美国英伟达推出Nemotron 3 Ultra，开放模型瞄准长任务智能体降本

2026-06-02 09:15

关键词:

维度网讯，6月1日，英伟达首席执行官黄仁勋在中国台湾台北举行的COMPUTEX 2026相关活动中发布新AI模型Nemotron 3 Ultra。该模型面向企业级智能体工作流，重点覆盖代码、研究、企业流程自动化和长时间任务执行等场景。

Nemotron 3 Ultra的发布，使英伟达的角色继续从AI芯片供应商向“算力平台+模型+开发工具”组合扩展。公开信息显示，Nemotron 3 Ultra是一款5500亿参数的混合专家模型，面向长任务智能体设计，在复杂智能体任务中可实现更高推理速度，并降低运行成本。对于企业客户而言，智能体应用的成本压力并不只来自单次问答，而是来自持续调用工具、读取企业数据、执行多步骤计划、反复校验结果和长上下文推理。模型如果无法在长任务中保持稳定性和效率，企业很难把智能体从内部试点推向生产系统。英伟达选择在Nemotron 3 Ultra上强调推理速度、成本和长任务能力，实际上是在回应企业级AI从“能生成内容”进入“能执行流程”后的新需求。

该模型属于Nemotron 3开放模型体系。英伟达此前已经推出Nano、Super、Ultra等不同规模模型，分别面向轻量化部署、高吞吐推理和复杂智能体任务。

从技术路径看，Nemotron 3 Ultra延续了英伟达围绕开放模型、NVIDIA NIM、NeMo、CUDA-X和企业软件生态的组合打法。企业部署智能体时，通常需要模型具备推理、代码生成、工具调用、流程规划、结果验证和安全控制等多项能力，同时还要适配私有云、本地数据中心、行业软件和企业权限系统。英伟达的优势不只在模型本身，还在于其GPU、推理服务、软件库和开发者生态可以形成统一交付路径。Nemotron 3 Ultra若能与现有AI基础设施结合，将有助于企业把智能体应用嵌入网络安全、运营决策、研发协作、客户服务、IT自动化和数据分析等流程，减少单独适配不同模型和不同推理框架的工程成本。

这次发布也与英伟达扩大AI PC、物理AI和企业智能体布局形成呼应。黄仁勋在同一阶段还围绕PC芯片、智能体工具包和机器人相关模型介绍新进展，显示英伟达正在把AI能力从数据中心继续延伸到个人终端、企业桌面、机器人和自动驾驶等更广泛场景。Nemotron 3 Ultra承担的是企业智能体和开放模型层面的能力补位，它与硬件芯片、推理平台和开发工具共同构成英伟达面向下一阶段AI应用的基础设施。后续变量集中在模型开放程度、实际推理成本、长任务稳定性、企业软件集成速度，以及开发者是否愿意围绕Nemotron体系构建专用智能体应用。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国