英伟达(NVIDIA)与Palantir Technologies近日宣布达成合作,共同推进主权AI技术发展。这一合作在英伟达即将举行的GTC活动前公布,旨在为具有数据主权需求的企业和政府客户提供AI解决方案。
Palantir推出的AI操作系统参考架构(AIOS-RA)基于英伟达的企业参考架构设计,面向需要处理延迟敏感工作流、拥有现有GPU架构和广泛地理分布的客户。该平台运行在八块英伟达Blackwell Ultra GPU上,并采用英伟达Spectrum-X以太网支持AI推理和训练。技术栈还包括英伟达AI Enterprise、CUDA-X库、Nemotron开放模型和Magnum IO。
在Palantir方面,AIOS-RA提供一个统一管理平台,集成Rubix零信任Kubernetes平台、Apollo自主部署和生命周期管理服务,以及以企业AI为中心的AIP套件。整体计算结构涵盖Foundry服务,用于目录和构建等功能。
英伟达通过与Palantir的合作,进一步扩展其主权AI布局。此前,英伟达已与Orange Business、印度的NxtGen和英国政府达成类似协议。同时,Palantir与埃森哲签署协议,协助总部位于英国的基础设施提供商Sovereign AI为欧洲的商业和政府领域提供主权基础。
埃森哲欧洲技术研究负责人Surya Mukherjee在最近一次采访中,将AI主权定义为涵盖整个技术栈的概念。他指出:“AI在哪里决策,使用什么数据,以及它产生什么?所以这是两个层面。然后在细粒度层面考虑模型本身的安全性:哪个国家生产,在哪里生产?”
Mukherjee引用斯坦福AI指数研究数据,显示70%的领先大型语言模型(LLMs)在美国制造,25%在中国。“这意味着95%的全球模型不在欧洲生产,”Mukherjee说。“作为国家和公司,这都需要深思熟虑。”
英伟达企业AI平台副总裁Justin Boitano评论道:“AI正在重新定义基础设施栈——要求苛刻、延迟敏感和数据主权环境需要全栈架构——从芯片到系统再到软件。通过将Palantir的主权AI操作系统参考架构与英伟达AI基础设施结合,行业和国家可以快速、高效、可信地将数据转化为智能。”
Palantir首席架构师Akshay Krishnaswamy补充道:“从我们与美国政府的首次部署到之后的每一次部署,我们的软件都必须在最复杂和敏感的环境中满足要求,客户必须保持控制。与英伟达合作——并基于许多客户的现有投资——我们自豪地提供一个完全集成的AI操作系统,优化用于英伟达加速计算基础设施,使客户能够实现本地、边缘和主权云部署的承诺。”









