维度网讯,算苗科技宣布其面向大模型推理的3D TokenPU芯片A4E已于6月15日流片。该芯片基于国产供应链,采用3D混合堆叠架构,旨在为大模型产业提供自主可控的算力支撑。德勤预测,未来超过80%的算力需求将集中在推理侧。

大模型推理长期受制于数据在存储器与处理器之间的频繁搬运,由此带来高达80%的能耗和70%的成本压力。算苗科技推出的3D TokenPU架构将8层存储晶圆垂直堆叠在计算逻辑晶圆上,通过硅通孔(TSV)与凸点(bump)技术实现微米级互联,将传统毫米级的传输距离压缩两个数量级,提供16TB/s的访存带宽。芯片引入Tile-Native软硬件协同理念,将Tile作为数据搬运、存储和计算的基本单元,实现一次搬运、多次复用的模式。硬件原生支持Tile级数据调度与多精度动态切换,软件端构建适配LLVM、Triton等开源生态的编译工具栈。
算苗科技创始人兼CEO汪福全博士表示,3D TokenPU专为大模型Token处理而生,不单纯依赖制程缩小,即可实现算力密度与能效比的提升。
算苗科技已构建覆盖芯片设计、核心IP、制造、封装的国产化供应链体系。A4E芯片基于自研RISC-V架构与自研IP、自研软件体系打造,与国内供应链伙伴合作,采用成熟国产工艺。团队核心成员在高通量存算一体芯片项目中完成万片级3D混合堆叠晶圆量产。公司研发人员占比超80%,核心骨干来自中科院、清华、北大等院校。
3D TokenPU面向头部大模型厂商,已与客户开展近一年的深度研发,在芯片定义阶段锚定推理场景需求,完成架构与底层算法调优。公司已获得国资平台、市场化基金与产业资本的多轮融资,投资方包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本等。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









