当地时间6月10日,亚马逊云科技(AWS)正式宣布,基于其去年12月发布的第五代自研Arm处理器——Graviton5的Amazon EC2 M9g和M9gd实例正式上线。这不仅是一次常规的硬件迭代,更被业界视为AWS为即将爆发的“智能体AI”(Agentic AI)时代所布下的关键一子。
3nm制程,192核芯
随着智能体AI(Agentic AI)的爆发,AI的工作负载正在发生根本性转变:从简单的“文本问答”转向“自主行动”——实时推理、代码生成、多步骤任务编排以及跨系统工具调用。这些任务对负责逻辑控制与调度的中央处理器(CPU)提出了前所未有的高并发、低延迟需求。采用大核心、大缓存、高内存带宽设计的AWS Graviton5,正是为了应对“智能体AI”需求而来。
Graviton5采用了台积电3nm制程工艺,在同样功耗下封装了更多晶体管,实现了更高的电路密度与能效比。
Graviton5所搭载的Neoverse V3内核由Arm与AWS Annapurna Labs联合定义。其一级缓存(64 KB)、二级缓存(2 MB)虽非最大亮点,但三级缓存(L3 Cache)暴增5倍,达到192 MB,能够将海量热点数据留在离核心更近的地方。同时,其分支预测能力大幅提升,使得运行真实数据库等复杂代码时的性能提升高达30%,这远非那些只能跑分的小型循环测试所能比拟。
在核心数量方面,Graviton5从Graviton4的96核一举提升至192核,实现了100%的增长。但更重要的是,AWS放弃了此前的单一计算核心芯片(Die)架构,转而采用了一套先进的4芯片组(Chiplet)设计。这意味着192个核心被均匀分布在4个独立的芯片组上,每个芯片组包含48个核心,并集成了专属的DRAM内存控制器和PCIe 6.0 I/O控制器。
这种设计带来了两大优势:首先,数据无需再长距离穿越整个芯片去访问内存或I/O设备,极大降低了延迟;其次,通过定制的芯片间互连技术,四个芯片组之间可提供高达420 GB/s的带宽,确保整体计算网格的协同效率。
更关键的是,Graviton5成为云端首个支持DDR5-8800内存和PCIe Gen 6的处理器。AWS强调,通过与DRAM制造商的紧密合作,Graviton5提供的内存速度是当前所有云端处理器中最快的。对于内存带宽敏感型应用(如大型数据库、实时分析),这意味着瓶颈的显著放宽。
此外,Graviton5还采用了去盖设计(去掉CPU金属散热顶盖,让裸片直接接触散热设备),使散热风扇功耗降低33%。
AWS此前在公告中曾明确称Graviton5为“迄今为止性能最强、能效最高的自研CPU”(our most powerful and energy efficient custom-designed chip yet)。虽然这限定于AWS自研芯片范畴,但考虑到AWS在Arm服务器芯片领域的市场地位,这一表述具有相当的参考价值。
M9g实例的跨场景碾压
Graviton5的硬件参数的提升最终要落地为实例性能的改善。作为Graviton5的首发载体,M9g实例在多个维度交出了令人信服的成绩单。
根据AWS官方数据,M9g实例相比上一代基于Graviton4的M8g实例:通用计算性能提升 25%;Web应用性能提升 35%;机器学习推理性能提升 35%;数据库性能提升 30%。
在长达数月的预览期,多家行业标杆客户用实际生产环境验证了这些数字:
ClickHouse:在零代码更改的情况下,获得 36% 的性能提升。
Honeycomb:在生产可观测性工作负载的6个月A/B测试中,每核心吞吐量提升 36%。
HubSpot:将MySQL数据库迁移至M9g后,查询时长最高下降 60%。
Meta:已承诺签约部署数千万个Graviton核心用于其智能体AI项目,成为全球最大的Graviton客户之一。
对于需要本地高速存储的工作负载,AWS同时推出了M9gd实例,提供高达11.4 TB的NVMe SSD,IOPS比上一代提升30%。网络方面,最大实例的网络带宽提升至100 Gbps,EBS带宽提升至72 Gbps,并支持实例带宽配置(IBC),允许用户在VPC网络和EBS存储间动态调配最高25%的带宽,以适应不同的I/O敏感型任务。
首次集成Nitro隔离引擎
在性能之外,Graviton5首次引入了AWS安全体系的又一个里程碑——Nitro隔离引擎。
传统的虚拟化隔离基于软件和硬件的一系列检查与测试,理论上可能存在未被发现的漏洞。而Nitro隔离引擎利用形式化验证技术,这是一种通过数学逻辑来证明硬件或软件的行为完全符合预期(而非仅通过特定测试用例)的方法。该引擎作为一个专用组件,通过一组最小化的API严格管控对所有虚拟机内存、CPU寄存器状态及I/O设备的访问。
这使得AWS Nitro成为首个经过形式化验证的云管理程序。它不再是“我们相信它是安全的”,而是“从数学上证明它是安全的”。对于金融、政府和安全敏感型工作负载,这提供了一种前所未有的、数学级别的隔离保证。
上市与可用性
目前,M9g和M9gd实例已在AWS美国东部(弗吉尼亚北部、俄亥俄)、美国西部(俄勒冈)和欧洲(法兰克福)区域正式可用。客户可以通过按需、预留实例或Savings Plans等方式进行购买。为了帮助客户平滑迁移,AWS还提供了Graviton快速上手指南、成本节省仪表板以及AI驱动的代码转换服务AWS Transform,后者可以自动化地将Java应用从x86架构迁移到Graviton实例上。
根据AWS公布的数据,目前,已有超过12万家客户使用Graviton处理器,支持的实例类型超过350种,覆盖了从Web应用、微服务、容器到电子设计自动化(EDA)、游戏、视频编码的全领域。年收入超过200亿美元且保持三位数增长的芯片业务,证明了AWS自研路线不仅是技术探索,更已成为其云业务的核心利润与差异化引擎。
Graviton5的发布,标志着AWS在云端自研芯片的道路上再次迈出了决定性的一步。它不再满足于在性价比上追赶x86架构,而是通过对智能体AI工作负载的前瞻性优化,试图定义下一代云计算的计算基座。
