美国英特尔联合SambaNova与富士康推机架级推理AI架构
2026-06-03 09:39
收藏

维度网讯,英特尔(Intel)与SambaNova和富士康(Foxconn)合作,在2026年台北国际电脑展上推出专为推理和代理式AI工作负载设计的机架级架构。该平台整合了英特尔至强(Xeon)处理器、SambaNova的SN-50可重构数据流单元(RDU)及富士康的系统集成能力,面向超大规模数据中心、企业和新兴AI工厂提供生产就绪型AI机架。此举显示英特尔正推动CPU作为大规模AI部署核心组件的定位,以满足推理需求逐渐超越模型训练的市场趋势。

该架构反映了行业从以训练为中心向以推理为中心的基础设施演进。在训练场景中,通常约1个CPU支持4个GPU,而代理式工作负载规模扩大后,CPU与加速器的比例趋近1:1。机架设计侧重每瓦性能和每美元性能,而非训练吞吐量的最大化。英特尔指出,代理式AI对CPU的编排、调度、内存管理、数据移动及非矩阵工作负载执行提出更高要求。

英特尔通过Vector Core Compute展示了完全解耦的推理架构,该平台由Vista Equity Partners和Cambium Capital支持,定位为企业级专用推理云。在运行MiniMax 2.5模型的演示中,工作负载被动态拆分至不同的硅架构,以优化AI管线各阶段:编排与执行由英特尔至强6处理器处理,解码处理由SambaNova SN40 RDU执行,预填充操作由NVIDIA Blackwell GPU驱动。这一部署被视作首批生产级推理管线之一,在不同处理器类型间完成工作负载分布。Together.ai已签约成为首个商业客户。

公告核心内容包括:英特尔、SambaNova和富士康合作提供面向推理和代理式AI部署的机架级基础设施;富士康负责端到端系统集成、制造和部署,计划推出高密度CPU变体以优化推理、数据处理和混合AI成本;英特尔发布至强6+处理器(原代号Clearwater Forest),该产品基于英特尔18A工艺节点,首次在数据中心部署该制程。单个液冷机架可支持多达36,864个至强6+核心,设计在约100 kW机架功率范围内最大化AI代理并发。

英特尔CEO陈立武(Lip-Bu Tan)表示,随着推理、代理式和物理AI的兴起,英特尔致力于从芯片到系统层面提供创新。此次公告的重点在于英特尔试图定义完整的AI机架架构。NVIDIA已通过DGX、NVL72和AI工厂设计扩展至全栈AI基础设施,英特尔则采取类似策略,将至强定位为AI推理的编排层,同时与专用加速器供应商合作。与SambaNova的合作使英特尔获得成熟的推理加速器架构,而无需等待内部开发替代方案。在支出从训练转向生产级AI部署的背景下,功耗、利用率、延迟和总拥有成本成为关键指标。英特尔对CPU密度、机架级集成和解耦式推理的重视,意在抓住AI工厂中不需要大量训练GPU但仍需大规模编排和推理能力的市场机会。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com