维度网讯,6月1日,美国英伟达首席执行官黄仁勋发布新AI模型Nemotron 3 Ultra。该模型属于英伟达Nemotron 3开放模型家族,面向AI代理、复杂推理和主权AI建设场景,进一步补充其从芯片、软件到模型的AI基础设施布局。
Nemotron 3 Ultra的发布,延续了英伟达把模型能力与算力平台绑定推进的路径。英伟达过去的核心优势集中在GPU、网络、系统和软件栈,现在其AI布局正在向开放模型和代理基础设施延伸。Nemotron 3家族此前已包含面向不同规模部署的模型版本,其中Nemotron 3 Nano已作为NVIDIA NIM微服务提供,Nemotron 3 Super则被英伟达定位为面向复杂AI代理系统的开放模型,采用1200亿参数、120亿激活参数设计,并面向Blackwell平台优化。Nemotron 3 Ultra在这一产品线上承担更高能力层级角色,主要服务需要更强推理、更长任务链和更复杂多代理协作的应用。对企业和政府机构而言,开放模型的价值不只在于可调用,还在于能否结合本地数据、专属算力和安全部署要求,形成可控的AI应用基础。英伟达把Nemotron模型与NIM微服务、加速计算平台和企业AI工具链结合,也是在争夺AI代理时代的底层模型入口。
公开信息显示,英伟达在2025年12月发布Nemotron 3开放模型家族时曾提到,Nemotron 3 Super和Ultra预计于2026年上半年推出。6月1日黄仁勋发布Nemotron 3 Ultra,使这一高阶模型进入正式发布节点。多家媒体快讯也确认,英伟达CEO黄仁勋当天发布新AI模型Nemotron 3 Ultra。
Nemotron 3 Ultra的产业意义,集中在AI代理、企业部署和主权AI三个方向。AI代理要从演示走向生产流程,需要模型具备更强的任务规划、工具调用、上下文保持和多步骤执行能力,普通问答模型难以稳定覆盖长链路任务。企业在部署代理系统时,还会关注模型是否能在私有环境运行、是否能接入内部知识、是否支持权限控制和审计,以及是否能在既有GPU集群上高效推理。英伟达提供开放模型,可以让企业在NVIDIA加速基础设施上构建自有代理应用,减少完全依赖闭源API的限制。主权AI则是另一个关键场景,越来越多国家和地区希望把基础模型、本地语言、政务数据、行业知识和本地算力结合起来,建立更可控的AI能力。Nemotron 3 Ultra如果延续Nemotron 3家族的开放模型路线,将有利于政府、科研机构和产业客户围绕本地数据进行定制和部署。英伟达在GTC等场合已多次把Nemotron与主权AI、AI代理和企业级模型部署联系起来,模型发布与其GPU、服务器、NIM微服务、NeMo工具链共同构成更完整的AI基础设施组合。
英伟达发布Nemotron 3 Ultra后,后续观察点将集中在模型参数、开放权重许可、推理成本、部署入口、NIM服务支持、云平台可用性和企业客户导入情况。AI模型竞争已经从单纯参数规模转向模型能力、推理效率、部署可控性和应用生态协同,Nemotron 3 Ultra能否在AI代理和主权AI场景中形成持续采用,将影响英伟达模型层业务的外部认知。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









