维度网讯,高通(Qualcomm)正式推出其最新的近内存计算架构——高带宽计算(HBC),旨在突破长期制约AI处理性能的内存墙瓶颈。

高通在公告中表示,HBC架构将AI加速器与系统级芯片(SoC)分离,直接置于LPDDR DRAM堆栈下方。该加速器通过硅通孔连接LPDDR堆栈,以提供高带宽和高容量,无需使用昂贵的HBM内存和先进封装。高通称,该架构的每瓦带宽比HBM高6倍,容量是片上SRAM的200倍以上。
高通数据中心业务执行副总裁兼总经理托尼·皮亚利斯(Tony Pialis)解释,“将AI加速器从XPU中分离出来,并将XPU直接置于DRAM堆栈下方,带来了SRAM的性能优势以及堆叠内存的密度和容量,由此HBM相关的瓶颈消失。”他补充说,该方案可降低功耗和热量,并去除昂贵的硅中介层,企业还可使用标准封装集成多个HBC堆栈以提升性能成本比。
业内此前已有类似探索。无晶圆厂ASIC设计服务公司GUC曾提出DRAM-on-Logic(DoL)技术,将多至四层DRAM堆叠在逻辑之上,获得约5 TB/s内存带宽。由于高通未公布HBC的具体性能数据,目前难以与GUC方案直接比较。此外,高通未明确HBC加速器的具体功能,它可能是专用的近内存transformer引擎、张量核心集合,或用于AI推理或训练的预处理逻辑。
高通同时披露了HBC路线图。AI200加速器将于今年晚些时候推出,采用LPDDR5X,每机架提供43 TB RAM。后续产品AI250将采用第一代HBC,带宽是AI200的18倍。AI300将采用第二代HBC,带宽是AI300的54倍。
高通近期通过多项战略举措巩固其在AI市场的地位,包括完成一项价值40亿美元的收购,以及发布面向入门级笔记本的Snapdragon C产品,售价约400万印尼盾。HBC架构的推出正值半导体行业激烈竞争之际,三星Exynos 2600等传闻使业界关注最新制程进展。高通表明,其不仅关注处理器,也关注更高效的内存解决方案。

与HBM技术相比,高通方案采用标准封装和更便宜的LPDDR内存,以较低成本提供解决方案。但关于HBC在各类AI工作负载中的有效性仍有疑问。在详细规格和性能基准公布前,外界尚难以客观评估高通的声明。
与此同时,半导体行业内存创新持续。NEO Semiconductor近期宣布其用于AI处理器的3D X-DRAM通过概念验证。三星展示了首款采用Heat Path Block冷却技术的HBM5样机。对于高通而言,HBC的成功将取决于市场采纳,其需说服服务器和数据中心制造商相信该架构的附加值。
高通计划持续推动HBC技术多代发展。AI250搭配第一代HBC承诺提供18倍带宽提升,AI300搭配第二代HBC将提供54倍提升。这些数字若实现,将是AI领域巨大的性能飞跃。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









