美Tensordyne Napier 13倍于GB300 订单逾2亿
2026-06-16 09:44
收藏

维度网讯,Tensordyne公司(前身为2017年成立的Recogni)宣布其AI加速器“Napier”已完成流片。该芯片得名于对数发明者约翰·纳皮尔,其核心创新在于利用对数数学将AI模型运算中的大量乘法转换为加法。

由于加法运算效率更高,Tensordyne声称其单个Napier机架的计算性能远超采用英伟达GB300技术的AI服务器。根据AI模型的不同,一个Napier机架每秒可处理的Token数最高可达英伟达GB300 NVL72的13倍。以每秒每瓦Token数衡量的效率,甚至可能提升至17倍。

该公司透露,Napier系统已获得总价值超过2亿美元的订单,但尚未公布首批TDN72 Pod的具体交付时间。英伟达计划在2026年底前推出其专为推理优化的Groq 3 LPX系统,而此前同样针对推理发布的Rubin CPX项目似乎已被搁置。

得益于对数计算方式,Napier的实际计算单元可设计得更小,从而在芯片上集成更多核心并容纳高速SRAM。每颗Napier芯片配备144 GB HBM3E内存,并集成了超高速互连。一个TDN72 Pod由四个紧密相连的机架插槽组成,每个插槽包含9颗Napier芯片。一个完整的Tensordyne Napier机架则由四个TDN72 Pod构成,共集成288颗Napier芯片。

单个TDN机架可提供608 PFlops算力,配备42 TB HBM3E、78 GB SRAM和256 TB RAM。其满载功耗为120千瓦,支持风冷散热,机架内部互连传输速率高达275 TB/s。

Napier芯片可处理FP16、FP8、FP4和Int8等数据格式。据Tensordyne称,该芯片适用于Kimi K2.6、DeepSeek-R1/V4 Pro、Llama3.1 405B、Mixtral 8x22B、GPT-OSS-120B和Qwen 80B等主流AI模型。作为对比,英伟达计划在单个Groq-3-LPX机架中安装256颗Groq-3-LPU,每颗LPU配备500 MB SRAM,单个机架共拥有128 GB SRAM和12 TB DDR5 RAM。

Tensordyne总部位于硅谷,在慕尼黑设有分公司,多名高级开发人员此前就职于Juniper Networks(现隶属于HPE)。在Napier芯片的开发过程中,Tensordyne与博通进行了合作,博通也为谷歌等多代TPU开发AI芯片。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com