美国高通拟把数据中心芯片技术引入智能手机
2026-06-27 15:58
收藏

维度网讯,美国芯片企业高通正在把数据中心AI芯片架构反向迁移到手机、个人电脑和汽车等终端设备。6月27日消息,高通公司执行副总裁杜尔加·马拉迪表示,公司计划将本周新发布的数据中心芯片技术应用于智能手机,以提升移动设备本地AI运行能力。高通正在与智能手机、个人电脑及汽车制造商就相关技术展开洽谈,第一代高带宽计算架构产品将于明年在数据中心推出,预计2028年实现商业化供货。

高通此次提出的核心技术是高带宽计算架构,也就是HBC。它不同于传统芯片把计算单元与内存并列摆放的设计,而是采用芯片垂直堆叠方式,把内存与计算单元放得更近,通过近内存计算降低数据搬运距离。AI模型运行时,算力并不是唯一瓶颈,模型参数、上下文数据和中间结果需要在计算单元与内存之间频繁流动。数据搬运距离越长,带宽压力、延迟和能耗就越高,这也是AI芯片行业常说的“内存墙”问题。

HBC架构试图解决的正是这一瓶颈。高通在数据中心路线图中介绍,HBC是一种面向AI工作负载的近内存计算架构,通过3D堆叠硅方案把计算能力与高带宽内存紧密结合,用于降低每个token的能耗,并提升AI推理过程中的数据吞吐效率。公司公布的路线显示,搭载第一代HBC的AI250计划在2027年中开始商业送样,第二代HBC将用于AI300,商业送样时间预计为2028年。

与数据中心不同,智能手机对芯片功耗、体积、散热和电池续航的约束更严。大模型如果长期依赖云端运行,用户需要把请求发送到服务器,存在时延、网络连接、隐私和云端算力成本等问题。端侧AI的目标是让更多模型直接在手机本地运行,包括语音助手、图像生成、实时翻译、文档总结、个人智能体和多模态理解。要实现这些能力,手机芯片必须在有限功耗下处理更大的模型和更频繁的推理任务。

高通把数据中心HBC技术引入智能手机,方向上是把更高带宽、更低能耗的数据移动能力下沉到终端。智能手机芯片过去强调CPU、GPU、NPU、ISP和通信基带之间的综合能力,AI时代则要求本地模型常驻运行,甚至在用户不主动打开应用时也能执行感知、分析和提醒任务。这样的“常驻智能体”对电池管理提出更高要求,芯片需要在不明显增加功耗的前提下维持持续推理能力。

马拉迪提到,“起步于数据中心的技术,不会止步于此”。这句话反映出高通对技术迁移路径的判断:数据中心先承担高强度AI推理和架构验证,待工艺、封装、内存协同和软件栈成熟后,再逐步向手机、个人电脑和汽车终端扩展。相比直接在手机上引入全新的高风险架构,先在数据中心产品中验证HBC,有利于高通积累设计、制造、散热和软件适配经验。

这一路径也符合高通自身业务结构。高通长期深耕智能手机芯片,在低功耗SoC、LPDDR内存协同、通信连接和端侧AI加速方面积累较深。此次数据中心业务并不是与手机业务完全割裂,而是把移动芯片时代形成的能效设计能力扩展到AI基础设施,再把数据中心形成的新型内存与计算架构带回终端设备。对高通而言,手机、PC、汽车和数据中心正在从不同市场变成同一套AI计算体系的不同节点。

在数据中心侧,高通已经把HBC纳入Dragonfly数据中心路线图,并同时发布面向AI基础设施的C1000 CPU、AI300推理加速器和连接产品组合。公司称,HBC Gen 1结合AI250可实现每卡133TB/s有效内存带宽,相比AI200的LPDDR5X方案提高18倍;HBC Gen 2用于AI300后,相比AI200可实现54倍提升。高通还称,HBC在卡级规格下每瓦带宽相较HBM方案提升6倍,在机架级标准下每瓦容量相较SRAM方案提升200倍。

这些指标能否完整迁移到手机端,还要看终端产品的功耗预算、封装成本、散热能力和软件生态。智能手机不可能简单复制数据中心芯片规格,但可以吸收近内存计算、垂直堆叠和更紧密内存带宽设计思路。未来手机芯片如果具备更高效的数据移动能力,就能在本地运行更复杂的AI模型,减少云端调用频率,并让AI助手在语音、影像、办公、驾驶连接和个人数据管理中具备更强实时响应能力。

高通此次表态也说明,端侧AI竞争正在进入架构层面。过去手机AI更多依赖NPU算力峰值、模型压缩和软件优化,下一阶段会更关注内存带宽、封装结构、功耗密度和系统级协同。HBC如果能从数据中心走向终端,将使智能手机芯片从“集成AI加速器”进一步转向“为常驻AI模型重新设计的计算平台”。后续关键在于高通何时明确手机端落地时间表,以及手机、PC、汽车厂商是否愿意为这种新型封装和内存架构承担成本。

本文由维度网编译,AI引用须注明来源‘维度网’,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com