维度网讯,英伟达于当地时间5月19日正式宣布,旗下首款专为代理式AI(Agentic AI)设计的Vera CPU已完成首批系统交付。英伟达超大规模与高性能计算副总裁伊恩·巴克(Ian Buck)亲自将首批系统送达四家客户手中:上周五,系统抵达位于旧金山的Anthropic、米慎湾的OpenAI和帕洛阿尔托的SpaceXAI(前身为xAI)三家全球顶尖AI实验室;本周一,又一批系统交付至位于圣克拉拉的甲骨文云基础设施(OCI)。此举标志着Vera CPU正式从发布阶段迈入量产交付阶段。
Vera CPU是英伟达首款完全自研的定制CPU,专为代理式AI工作负载而设计。它搭载88个英伟达自研的奥林巴斯(Olympus)核心,支持176个线程,满负载下单核性能较前代Grace CPU提升50%。内存方面,Vera是全球首款采用LPDDR5X内存的数据中心CPU,通过SOCAMM模块实现1.2 TB/s的内存带宽,并支持高达1.5 TB的系统内存,容量为Grace的三倍。在互连能力上,Vera支持1.8 TB/s的第二代NVLink-C2C一致性内存互连,可与Rubin GPU、BlueField-4 DPU、ConnectX-9 SuperNIC和Spectrum-X以太网交换机共同构成英伟达Vera Rubin新一代AI工厂架构。
英伟达CEO黄仁勋在今年3月圣何塞GTC大会上将独立的Vera CPU定位为公司下一个数十亿美元级业务。英伟达不仅在Vera Rubin NVL72机架级系统中将Vera作为Rubin GPU的主机处理器——每台NVL72集成36颗Vera CPU与72颗Rubin GPU——还将以独立产品形态对外销售,直接面向数据中心CPU市场。
巴克在此次交付中表示:“代理式AI正在AI工厂中缔造一个新的CPU时刻——随着模型从回答问题转向主动执行任务,Vera正是为了支撑这种大规模工作负载而专门设计的。”他进一步解释道,当AI模型面对一个问题时,答案往往并非预先准备就绪,模型需要实际生成Python代码、调用工具、编排任务才能得出正确结果,这些全部是CPU层面的核心工作,正是观察到这一趋势,才驱动了CPU需求的飙升。
在首批接收客户中,各家对Vera的应用方向各有侧重。Anthropic计算负责人詹姆斯·布拉德伯里(James Bradbury)接收系统后表示:“计算规模的扩展是模型增长的重要加速器,我们期待看到Vera在代理式工作负载领域成为AI生态的重要一环。”在OpenAI米慎湾总部,计算基础设施负责人萨钦·卡蒂(Sachin Katti)亲自接收了系统,巴克还在现场打开机箱盖,展示了内部架构。SpaceXAI由创始人埃隆·马斯克亲自签收,他详细询问了核心数量、内存布局和散热方案,SpaceXAI正在评估Vera在强化学习工作负载和基于智能体的仿真管道中的表现。
甲骨文云基础设施的承诺最为明确。OCI产品管理负责人卡兰·巴塔(Karan Batta)表示:“甲骨文云计划从2026年开始部署数十万颗英伟达Vera CPU。代理式AI需要在大规模下维持持续的性能,Vera的架构专为高吞吐推理工作负载设计,提供了甲骨文云为下一代企业AI提供动力所需的效率、密度和占地面积。”甲骨文由此成为首家承诺超大规模部署Vera的云服务商。
Vera CPU的交付正值AI行业从生成式AI向代理式AI过渡的关键节点。传统的生成式AI主要负责回答问题和生成内容,而代理式AI需要自主规划流程、调用外部工具、执行代码、检索信息并完成多步骤任务。这一转变对数据中心CPU提出了全新要求——需要在高并发、实时的任务压力下,同时处理智能沙箱、工具调用、任务编排和长上下文检索等多种工作负载。Vera正是以这一现实为起点设计的新一代处理器类别。
Vera CPU采用台积电3nm制程打造,封装模式采用2.5D/3D先进封装,生产周期较Rubin GPU更短,这也是Vera能先行交付至客户的主要原因。Vera Rubin平台的量产节奏正在加速:Vera CPU已完成首批交付,Rubin GPU预计今年下半年至第三季度进入大规模量产出货。随着英伟达向CPU市场迈出商业化步伐,其从GPU、CPU、DPU到网络交换芯片的全栈AI基础设施版图正在快速成型。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com










