美国英特尔联合SambaNova与富士康推机架级推理AI架构

2026-06-03 09:39

关键词:

维度网讯，英特尔（Intel）与SambaNova和富士康（Foxconn）合作，在2026年台北国际电脑展上推出专为推理和代理式AI工作负载设计的机架级架构。该平台整合了英特尔至强（Xeon）处理器、SambaNova的SN-50可重构数据流单元（RDU）及富士康的系统集成能力，面向超大规模数据中心、企业和新兴AI工厂提供生产就绪型AI机架。此举显示英特尔正推动CPU作为大规模AI部署核心组件的定位，以满足推理需求逐渐超越模型训练的市场趋势。

该架构反映了行业从以训练为中心向以推理为中心的基础设施演进。在训练场景中，通常约1个CPU支持4个GPU，而代理式工作负载规模扩大后，CPU与加速器的比例趋近1:1。机架设计侧重每瓦性能和每美元性能，而非训练吞吐量的最大化。英特尔指出，代理式AI对CPU的编排、调度、内存管理、数据移动及非矩阵工作负载执行提出更高要求。

英特尔通过Vector Core Compute展示了完全解耦的推理架构，该平台由Vista Equity Partners和Cambium Capital支持，定位为企业级专用推理云。在运行MiniMax 2.5模型的演示中，工作负载被动态拆分至不同的硅架构，以优化AI管线各阶段：编排与执行由英特尔至强6处理器处理，解码处理由SambaNova SN40 RDU执行，预填充操作由NVIDIA Blackwell GPU驱动。这一部署被视作首批生产级推理管线之一，在不同处理器类型间完成工作负载分布。Together.ai已签约成为首个商业客户。

公告核心内容包括：英特尔、SambaNova和富士康合作提供面向推理和代理式AI部署的机架级基础设施；富士康负责端到端系统集成、制造和部署，计划推出高密度CPU变体以优化推理、数据处理和混合AI成本；英特尔发布至强6+处理器（原代号Clearwater Forest），该产品基于英特尔18A工艺节点，首次在数据中心部署该制程。单个液冷机架可支持多达36,864个至强6+核心，设计在约100 kW机架功率范围内最大化AI代理并发。

英特尔CEO陈立武（Lip-Bu Tan）表示，随着推理、代理式和物理AI的兴起，英特尔致力于从芯片到系统层面提供创新。此次公告的重点在于英特尔试图定义完整的AI机架架构。NVIDIA已通过DGX、NVL72和AI工厂设计扩展至全栈AI基础设施，英特尔则采取类似策略，将至强定位为AI推理的编排层，同时与专用加速器供应商合作。与SambaNova的合作使英特尔获得成熟的推理加速器架构，而无需等待内部开发替代方案。在支出从训练转向生产级AI部署的背景下，功耗、利用率、延迟和总拥有成本成为关键指标。英特尔对CPU密度、机架级集成和解耦式推理的重视，意在抓住AI工厂中不需要大量训练GPU但仍需大规模编排和推理能力的市场机会。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国