英伟达发布Nemotron 3 Super开源模型:MoE架构加持,企业级AI推理效率提升五倍
当地时间3月11日,英伟达宣布推出新一代开源大语言模型Nemotron 3 Super。该模型专为企业级多智能体系统设计,采用了全新的混合专家(MoE)架构,在推理吞吐量上实现突破,达到上一代模型的五倍以上。
Nemotron 3 Super的发布标志着英伟达在大模型领域的产品线进一步丰富。与面向通用对话场景的模型不同,Nemotron系列自诞生之初便聚焦企业级应用场景,此次推出的3 Super版本在多智能体协同、高并发推理等企业关键需求上做了针对性优化。其核心架构升级至混合专家(MoE)模式,这一技术路线通过将模型分解为多个“专家”子模块,在推理时仅激活与当前任务相关的部分,从而在不显著增加计算资源的前提下大幅提升处理效率。
据英伟达介绍,基于MoE架构的优化使得Nemotron 3 Super的推理吞吐量提升至上一代产品的五倍以上。这意味着企业在部署大规模AI应用时,能够在相同的硬件条件下处理更多的并发请求,或显著降低响应延迟。对于需要同时运行数十个乃至上百个AI智能体的复杂业务场景,这一性能提升具有实质性的商业价值。
作为开源模型,Nemotron 3 Super的发布也为企业客户提供了更高的定制灵活性。企业可以在其基础之上进行微调和私有化部署,既满足数据安全与合规要求,又能利用英伟达在底层算力上的持续优化。此次发布延续了英伟达在AI领域“硬件+软件+模型”全栈布局的战略思路,进一步巩固其在企业级AI市场的生态位。
相关推荐

上海电气中标芬兰128兆瓦数据中心配电设备项目,首次进入欧洲高端数据中心市场
2026-04-27

腾讯QClaw更新接入Hermes框架与DeepSeek-V4,微信小程序新增语音操控
2026-04-27

SpaceX今年第50次猎鹰9号发射 25颗星链卫星入轨
2026-04-27

中兴通讯Q1营收349.9亿元 计算业务占比达27%
2026-04-27

智驾新程与佑驾创新合资发力移动机器人双赛道,覆盖辅助驾驶前装与无人物流运营
2026-04-27

中国国家电网2026年具身智能采购破68亿元,分三大品类启动规模化部署
2026-04-27

DeepSeek API输入缓存价格降至首发十分之一,V4-Pro限时0.025元/百万Tokens
2026-04-27

前DeepSeek核心研究员阮翀加盟元戎启行首秀,公司全面转向大模型自动驾驶路线
2026-04-27

Anthropic发布Project Deal实验:高级AI代理在二手市场中比初级模型多赚70%
2026-04-27

中国国家超算互联网推出DeepSeek-V4限时免费对话服务,百万Token上下文免费用
2026-04-27
最新简讯
