维度网讯,6月2日,美国微软AI超级智能团队发布MAI-Thinking-1,这是微软AI推出的首个推理模型。该模型采用稀疏混合专家架构,拥有350亿活跃参数、约1万亿总参数,面向复杂多步指令、长上下文推理和代码生成任务,并已在Microsoft Foundry开启私有预览。
MAI-Thinking-1的推出,意味着微软正在把自研模型体系从轻量模型、图像生成、语音转写和编码辅助,继续推进到更核心的推理模型层。微软过去在人工智能产品中大量引入外部前沿模型能力,但企业级客户在真实部署中还关注模型训练数据来源、成本控制、推理效率、合规边界和长期平台整合。MAI-Thinking-1被设计为中等规模模型,使用企业级、干净且具备商业许可的数据从头训练,没有通过第三方前沿模型蒸馏获得能力。微软强调这一点,目的在于增强模型能力来源的可解释性和可控性,也为企业客户在代码开发、复杂任务处理和长文档分析中使用自研模型提供更清晰的合规基础。对于微软而言,MAI-Thinking-1并非孤立产品,而是其“Hill-Climbing Machine”模型开发体系中的关键节点,背后连接数据、奖励、训练环境、评测体系和自有加速器协同设计,指向的是一套可持续迭代的内部模型生产机制。
该模型支持256K上下文窗口,兼容常用Chat Completions API,并支持函数调用和开发者指令。微软称,MAI-Thinking-1在软件工程基准SWE-Bench Pro上可与Claude Opus 4.6相当,在AIME 2025和AIME 2026数学推理测试中分别达到97.0%和94.5%。
微软把首个AI推理模型的重点放在软件工程和企业工作流,反映出推理模型竞争正在从单纯追求参数规模,转向“能否以更低推理成本进入日常开发场景”。编码任务天然适合检验推理模型的多步骤能力:模型需要读取代码库、理解上下文、修改文件、运行测试、定位失败原因,并根据中间结果调整方案。MAI-Thinking-1针对代理式编码环境进行了训练,微软为其构建了可执行、可评分、可重复验证的训练环境,使模型在接近真实开发流程的任务中学习。若这类能力能稳定接入GitHub Copilot、Visual Studio Code、Microsoft Foundry和企业内部开发平台,微软将有机会把自研模型能力嵌入开发者日常工具链,而不是仅停留在模型展示和单次问答场景。模型的中等规模定位也有现实意义:企业部署先进编码辅助时,需要在效果、延迟、调用频率和单次成本之间取得平衡,350亿活跃参数的稀疏模型有助于降低推理足迹,使高级编码和复杂推理能力更容易进入高频工作流。
MAI-Thinking-1也显示出微软AI战略的结构变化。微软仍会维持多模型平台和合作生态,但自研推理模型可以增强其在模型层的主动权,并把基础模型、云平台、开发者工具、企业安全和数据治理连接得更紧。随着Microsoft Foundry承载更多MAI系列模型,企业客户未来可在同一平台内调用微软自研模型、第三方模型和定制模型,微软则通过治理、合规、安全和Azure数据驻留能力强化平台粘性。
后续变量集中在公测时间、模型在真实企业代码库中的稳定性、调用成本,以及其与Copilot和Foundry生态的整合深度。MAI-Thinking-1已经补上微软自研推理模型的重要一环,但能否在企业级开发与生产力工作流中形成规模使用,还需要通过私有预览后的客户反馈和更大范围部署来验证。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









