MiniMax 在上海发布 M2.7大语言模型,具备自我进化能力,可执行 30-50% 强化学习工作流程
2026-03-19 09:52
收藏

近日,中国人工智能初创公司 MiniMax 发布了名为 M2.7 的专有大语言模型。该模型具备自我进化能力,能够处理其自身开发流程中 30% 至 50% 的强化学习研究工作,标志着 AI 模型向自主优化方向迈出重要一步。

MiniMax M2.7 self-evolving RL research workflow diagram

MiniMax M2.7 是一款纯推理文本模型,专为驱动 AI 智能体设计,可作为 Claude Code、Kilo Code 和 OpenClaw 等第三方框架的后端。该模型通过自主触发日志读取、调试和指标分析,优化其编程性能,在 MLE Bench Lite 竞赛中获得 66.6% 的奖牌率,性能与谷歌 Gemini 3.1 持平。

与 2026 年 2 月发布的前代 M2.5 相比,M2.7 在软件工程和专业办公任务方面有显著提升。在 SWE-Pro 基准测试中得分为 56.22%,在 GDPval-AA 上 Elo 分数为 1495,幻觉率降至 34%。该模型在 Artificial Analysis Intelligence Index 上得分为 50,全球总排名第 8 位。

MiniMax 工程负责人 Skyler Miao 在社交网络 X 上表示:“我们特意训练模型,使其更擅长规划和与用户澄清需求。下一步是开发一个更复杂的用户模拟器,以进一步推动这一点。”

MiniMax M2.7 作为专有模型,可通过 API 和 Agent 创建平台获取,定价为每 100 万输入令牌 0.30 美元,输出令牌 1.20 美元。公司提供多种订阅计划,并支持集成到超过 11 种开发者工具中,包括 Claude Code、Cursor 和 Zed。

MiniMax M2.7 benchmark comparison chart.Artificial Analysis Intelligence Index MiniMax M2.7 update

分析显示,运行 M2.7 的成本不到 GLM-5 的三分之一,例如标准智能指数成本为 176 美元,而 GLM-5 为 547 美元。该模型在 Office 套件保真度和财务建模方面表现突出,适合专业文档工作流组织。然而,作为中国公司部署的模型,其受中国法律约束,且目前不可离线使用,可能影响在某些地区的推广。

总体而言,MiniMax M2.7 的自我进化能力推动了 AI 智能体向生产就绪实用性发展,为技术决策者提供了高效、成本优化的解决方案。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com