单芯片混合精度浮点算力达 896TFLOPS,中昊芯英新一代 TPU 芯片「须臾」发布

IT之家 6 月 30 日消息,中昊芯英今天宣布推出新一代全自研高性能 TPU AI 专用芯片「须臾」,软硬件一体化智算底座「泰则 2.0」也在今天同步亮相。

据介绍,须臾的单芯片混合精度浮点算力可达 896 TFLOPS,性能是上一代芯片「刹那」的 3 倍;8-bit 推理算力可达 1792TOPS,适配海量词元高并发推理场景。须臾的显存、芯片内部互联速率均有大幅提升,支持超长上下文。单卡额定功耗 600W,相比传统算力芯片功耗降低 50%,助力低碳数据中心建设。

同时,须臾的芯片 IP 核、专属指令集、底层算子加速库、整机系统软件均是完整自主研发,无海外核心技术依赖。满足政务、金融、电网等行业的安全合规要求。

而「泰则 2.0」则是高性能智算平台中标准的最小计算单元,它搭载两路高性能 CPU 处理器与 8 片高性能 TPU 处理单元,从物理形态上形成 1 台通用的 CPU 服务器外接 1 台高性能 TPU 算力加速设备,算力达 7.168P(IT之家注:混合精度),同等任务下整机能耗仅为传统 GPU 服务器的 80%。

此外,该平台从软件层面实现了全主流 AI 框架兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具,训练场景适配 DeepSpeed、Megatron-LM 分布式套件;已完成 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言、多模态模型深度适配,开发者可快速完成模型迁移。

上一篇:奕境曾清林:好的智驾必须在“绝对安全”和“通行效率”之间找动态平衡
下一篇:系列最强智能体 AI 模型:Claude Sonnet 5 登场,部分性能逼近 Opus 4.8
免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。