美国英伟达发布Nemotron 3 Ultra模型，强化AI代理与主权AI模型布局

2026-06-01 13:45

关键词:

维度网讯，6月1日，美国英伟达首席执行官黄仁勋发布新AI模型Nemotron 3 Ultra。该模型属于英伟达Nemotron 3开放模型家族，面向AI代理、复杂推理和主权AI建设场景，进一步补充其从芯片、软件到模型的AI基础设施布局。

Nemotron 3 Ultra的发布，延续了英伟达把模型能力与算力平台绑定推进的路径。英伟达过去的核心优势集中在GPU、网络、系统和软件栈，现在其AI布局正在向开放模型和代理基础设施延伸。Nemotron 3家族此前已包含面向不同规模部署的模型版本，其中Nemotron 3 Nano已作为NVIDIA NIM微服务提供，Nemotron 3 Super则被英伟达定位为面向复杂AI代理系统的开放模型，采用1200亿参数、120亿激活参数设计，并面向Blackwell平台优化。Nemotron 3 Ultra在这一产品线上承担更高能力层级角色，主要服务需要更强推理、更长任务链和更复杂多代理协作的应用。对企业和政府机构而言，开放模型的价值不只在于可调用，还在于能否结合本地数据、专属算力和安全部署要求，形成可控的AI应用基础。英伟达把Nemotron模型与NIM微服务、加速计算平台和企业AI工具链结合，也是在争夺AI代理时代的底层模型入口。

公开信息显示，英伟达在2025年12月发布Nemotron 3开放模型家族时曾提到，Nemotron 3 Super和Ultra预计于2026年上半年推出。6月1日黄仁勋发布Nemotron 3 Ultra，使这一高阶模型进入正式发布节点。多家媒体快讯也确认，英伟达CEO黄仁勋当天发布新AI模型Nemotron 3 Ultra。

Nemotron 3 Ultra的产业意义，集中在AI代理、企业部署和主权AI三个方向。AI代理要从演示走向生产流程，需要模型具备更强的任务规划、工具调用、上下文保持和多步骤执行能力，普通问答模型难以稳定覆盖长链路任务。企业在部署代理系统时，还会关注模型是否能在私有环境运行、是否能接入内部知识、是否支持权限控制和审计，以及是否能在既有GPU集群上高效推理。英伟达提供开放模型，可以让企业在NVIDIA加速基础设施上构建自有代理应用，减少完全依赖闭源API的限制。主权AI则是另一个关键场景，越来越多国家和地区希望把基础模型、本地语言、政务数据、行业知识和本地算力结合起来，建立更可控的AI能力。Nemotron 3 Ultra如果延续Nemotron 3家族的开放模型路线，将有利于政府、科研机构和产业客户围绕本地数据进行定制和部署。英伟达在GTC等场合已多次把Nemotron与主权AI、AI代理和企业级模型部署联系起来，模型发布与其GPU、服务器、NIM微服务、NeMo工具链共同构成更完整的AI基础设施组合。

英伟达发布Nemotron 3 Ultra后，后续观察点将集中在模型参数、开放权重许可、推理成本、部署入口、NIM服务支持、云平台可用性和企业客户导入情况。AI模型竞争已经从单纯参数规模转向模型能力、推理效率、部署可控性和应用生态协同，Nemotron 3 Ultra能否在AI代理和主权AI场景中形成持续采用，将影响英伟达模型层业务的外部认知。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国