维度网讯,英伟达(NVIDIA)Vera Rubin平台已全面投产,该平台面向自主AI工作负载的AI基础设施部署,与上一代Grace Blackwell平台相比,其大规模部署的自主吞吐量提升高达10倍。Vera Rubin是一个机群级系统,由五个集成机架组成,整合了Vera Rubin NVL72系统、Vera CPU、BlueField-4网络和存储组件以及Spectrum-6以太网机架。

台湾服务器制造商及其他供应链合作伙伴正基于Vera Rubin构建系统,服务于AI实验室、云服务提供商和超大规模运营商。Vera Rubin是英伟达MGX机架级系统的第三代产品,MGX设计获得数百家供应链合作伙伴支持,涵盖台湾约150家厂商及30个国家的350多家工厂。生产Vera Rubin系统的系统构建商、基础设施软件提供商和存储公司包括戴尔科技(Dell Technologies)、慧与(HPE)、联想(Lenovo)、超微(Supermicro)、AIC、Aivres、华擎(ASRock Rack)、华硕(ASUS)、Cloudian、仁宝(Compal)、DDN、Everpure、富士康(Foxconn)、技嘉(GIGABYTE)、Hitachi Vantara、Hyve Solutions、IBM、英业达(Inventec)、MinIO、迈达思(MiTAC Computing)、微星(MSI)、NetApp、Nutanix、和硕(Pegatron)、广达云技术(Quanta Cloud Technology, QCT)、VAST Data、WEKA、纬创(Wistron)和纬颖(Wiwynn)。
针对横向扩展和跨层扩展的AI基础设施,Vera Rubin平台包括采用共封装光学(co-packaged optics)技术、配备200Gb/s串行器/解串器(SerDes)的英伟达Spectrum-X以太网光子学(Spectrum-X Ethernet Photonics)交换机,现已投产。英伟达报告称,与基于传统收发器的网络相比,Spectrum-X以太网光子学可提供高达5倍的能效、高达5倍更长的正常运行时间以及1.3倍更快的部署速度。CoreWeave、Lambda和甲骨文云基础设施(Oracle Cloud Infrastructure)被列为早期采用者。Vera Rubin平台还包括BlueField-4 DPU,支持高达800Gb/s的软件定义网络和内置的多租户隔离。BlueField-4高级安全可信资源架构旨在简化网络运营、改善租户隔离并增强大型GPU集群的控制能力。
Vera Rubin平台包含全栈机密计算,可在机架级实现可信执行。Vera Rubin NVL72将Vera CPU、Rubin GPU、NVLink网络和安全功能整合到一个平台中,并对高速互连进行加密。平台包含硬件级证明,确保系统完整性。已采用机密计算的云提供商包括CoreWeave、Firmus、GMI Cloud、IBM Cloud、IREN、Lambda、微软Azure(Microsoft Azure)、Nebius、Nscale、SpaceXAI和Vultr。DOCA软件平台旨在为Vera Rubin机架和基础设施层提供安全保护,包括通过BlueField-4硬件保护数据、代理、上下文记忆和AI推理。DOCA支持多租户隔离、零信任策略执行、运行时威胁检测和端到端加密,速度高达800Gb/s,且无需使用主机CPU资源。
DSX平台为基于Vera Rubin的AI基础设施提供设计和运营框架,旨在协调整个技术栈的系统设计、生命周期管理和多租户运营。该平台整合了参考设计、仿真、基础设施软件、设施指导和生态系统技术。采用DSX进行Vera Rubin部署的组织包括戴尔科技、慧与、联想、超微、华硕、富士康、技嘉、和硕、广达云技术(QCT)、纬创和纬颖。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









