维度网讯,德国人工智能芯片初创公司Tensordyne发布了名为“Tensordyne Napier”的新系统,该系统采用对数数学替代传统乘法器,在运行AI推理任务时功耗约为300瓦,较英伟达同类芯片的1000瓦显著降低。
Tensordyne总部位于慕尼黑和桑尼维尔,成立于2017年,员工约115人。公司已完成流片,芯片由台积电以3纳米工艺制造,并与HPE Juniper Networks、Broadcom和台积电合作。首批芯片约1000颗,电路板产自台湾,最终系统在马来西亚的Flex进行组装。
核心创新“TDN Math”基于对数运算规则:A乘以B的对数等于A的对数加上B的对数,从而用加法替代乘法,无需传统乘法器。这降低了纯计算面积和功耗,为内存、数据连接等组件留出更多空间。目前芯片最大尺寸约为800平方毫米。除数学技术外,系统还包含自主研发的AI处理器“TDN AIP”(片内集成SRAM和高带宽内存)以及芯片间互联技术“TDN Link”(延迟低于1微秒)。
软件方面,Tensordyne支持PyTorch和Triton框架,正在Hugging Face构建模型中心。此前在64颗英伟达芯片上运行的DeepSeek、Qwen或Kimi等大型混合专家模型可直接采用相同配置。区别在于物理连接:大型英伟达系统使用大量线缆,而Tensordyne通过HPE Juniper的机箱技术实现芯片间通信,完全无缆,数据传输采用电信号。

公司目前已完成超过2亿美元融资,投资方包括Celesta Capital和英特尔CEO陈立武的基金,计划于2026年第四季度进行D轮融资。Tensordyne声称已获得多家“Neo Cloud”提供商的预订单,并与一家超大规模企业签署了联合开发协议(名称未公开)。单个合同规模约1000万至2000万美元,预计年底前预订单金额将达1亿美元。
联合创始人Gilles Backhus表示,AI推理能耗将因视频生成等因素大幅增长,一个实时4K视频流可能消耗约100千瓦。以当前英伟达硬件为例,生成一小时AI视频内容的成本超过1000美元,而Tensordyne系统可将成本降至每小时约60至100美元,并实时交付、分辨率无损。此外,复杂查询的应答时间可通过72颗芯片的并行处理缩至30秒,大型混合专家模型每用户每秒输出高达1000个Token。每百万Token的成本可在官网“Tokenomics Calculator”查询。Backhus指出,编译器质量同样关键,好的编译器与极佳编译器之间的差异可使芯片利用率从30%提升至90%。
Backhus强调,真正的创新在于架构和数学而非材料选择。第一代7纳米工艺芯片已配备对数数学,在持久测试中约两年半无故障运行。当前最大瓶颈是高带宽内存(HBM),该内存主要由三星、美光和SK海力士生产。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









