MiniMax 在上海发布 M2.7大语言模型，具备自我进化能力，可执行 30-50% 强化学习工作流程

2026-03-19 09:52

关键词:

近日，中国人工智能初创公司 MiniMax 发布了名为 M2.7 的专有大语言模型。该模型具备自我进化能力，能够处理其自身开发流程中 30% 至 50% 的强化学习研究工作，标志着 AI 模型向自主优化方向迈出重要一步。

MiniMax M2.7 self-evolving RL research workflow diagram

MiniMax M2.7 是一款纯推理文本模型，专为驱动 AI 智能体设计，可作为 Claude Code、Kilo Code 和 OpenClaw 等第三方框架的后端。该模型通过自主触发日志读取、调试和指标分析，优化其编程性能，在 MLE Bench Lite 竞赛中获得 66.6% 的奖牌率，性能与谷歌 Gemini 3.1 持平。

与 2026 年 2 月发布的前代 M2.5 相比，M2.7 在软件工程和专业办公任务方面有显著提升。在 SWE-Pro 基准测试中得分为 56.22%，在 GDPval-AA 上 Elo 分数为 1495，幻觉率降至 34%。该模型在 Artificial Analysis Intelligence Index 上得分为 50，全球总排名第 8 位。

MiniMax 工程负责人 Skyler Miao 在社交网络 X 上表示：“我们特意训练模型，使其更擅长规划和与用户澄清需求。下一步是开发一个更复杂的用户模拟器，以进一步推动这一点。”

MiniMax M2.7 作为专有模型，可通过 API 和 Agent 创建平台获取，定价为每 100 万输入令牌 0.30 美元，输出令牌 1.20 美元。公司提供多种订阅计划，并支持集成到超过 11 种开发者工具中，包括 Claude Code、Cursor 和 Zed。

MiniMax M2.7 benchmark comparison chart.

Artificial Analysis Intelligence Index MiniMax M2.7 update

分析显示，运行 M2.7 的成本不到 GLM-5 的三分之一，例如标准智能指数成本为 176 美元，而 GLM-5 为 547 美元。该模型在 Office 套件保真度和财务建模方面表现突出，适合专业文档工作流组织。然而，作为中国公司部署的模型，其受中国法律约束，且目前不可离线使用，可能影响在某些地区的推广。

总体而言，MiniMax M2.7 的自我进化能力推动了 AI 智能体向生产就绪实用性发展，为技术决策者提供了高效、成本优化的解决方案。

中国