美国洛斯阿拉莫斯国家实验室将建三台采用NVIDIA Vera CPU的超算
2026-06-23 10:07
收藏

维度网讯,美国洛斯阿拉莫斯国家实验室(LANL)与HPE和NVIDIA合作新建三台超级计算机,分别命名为Mission、Vision与Veritas,将采用NVIDIA Vera CPU以加速科学发现,并为科学领域解锁自主AI(agentic AI)能力。

这些超级计算机基于HPE Cray Supercomputing GX5000架构和NVIDIA Vera Rubin平台,集成了NVIDIA Vera CPU、NVIDIA Rubin GPU和NVIDIA Quantum-X800 InfiniBand网络。

在计划配置下,Mission系统将包含NVIDIA Vera Rubin GPU节点以及2300个独立的NVIDIA Vera CPU(采用HPE Cray Supercomputing GX240刀片)。Veritas系统将配备约1150个独立的NVIDIA Vera CPU,以补充NVIDIA Vera Rubin节点。

Veritas将与Mission和Vision一同交付,服务于实验室指导的研究与发展计划,旨在加速科学自主AI的应用。该系统将用于测试相关技术,为LANL正在构建的更大规模系统做准备。

研究人员正通过AI智能体(AI agents)为科学增添新工具。这些智能体能够形成假设、选择工具、启动模拟、分析输出并优化后续步骤。LANL在URSA(通用研究与科学智能体,Universal Research and Scientific Agent)上的公开工作,该智能体运行于Venado并即将部署于Mission和Vision,正朝着这一方向发展:一个模块化、反馈驱动的AI框架,旨在帮助科学家头脑风暴假设、规划实验、运行模拟并分析结果。

LANL的测试证明,Vera CPU在URSA工作负载上的性能达到Crossroads x86超级计算机CPU的7倍。在LANL对NVIDIA Vera CPU应用于Branson(一款开源蒙特卡洛传热模拟工具)的早期测试中,Vera的性能比Crossroads x86超级计算机使用的CPU高出3倍以上。

这些成果得益于Vera的定制Olympus核心、LPDDR5内存和快速片上互连(on-chip fabric)。单个Vera CPU的性能是单个基于x86的CPU的3倍以上,同时每核心内存超过4倍,每节点内存超过6倍。这意味着能为LANL带来更快的科学成果。

该实验室的所有超级计算机均由硬件架构师、系统软件开发者、领域科学家、计算机科学家和应用数学家共同设计,确保系统由实际科学工作负载而非抽象基准所塑造。

Mission预计于2027年投入运行,将成为美国国家核安全管理局先进模拟与计算计划(Advanced Simulation and Computing program)中的第五台先进技术系统,并将取代Crossroads处理机密国家安全工作负载。Vision也预计于2027年投入运行,将为基础科学提供资源,包括材料与核科学、能源建模、生物医学研究和AI,让更多科学家在进入更高影响工作之前测试方法、训练模型和探索想法。

这项工作延续了LANL与NVIDIA在CPU方面超过十年的深入合作,从Grace到Vera,采用极限协同设计(extreme codesign)应对LANL的模拟工作负载。这三台新超级计算机建立在Venado之上,Venado是2024年在洛斯阿拉莫斯安装的HPE Cray EX超级计算机,采用NVIDIA GH200 Grace Hopper超级芯片和NVIDIA Grace CPU超级芯片。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com