小米AI模型MiMo-V2.5系列公测，Pro版性能对标GPT-5.4并开源

2026-04-23 09:05

关键词:

维度网讯，小米于4月23日宣布其AI模型Xiaomi MiMo-V2.5系列正式开启公测。该系列共推出四款AI模型：MiMo-V2.5、MiMo-V2.5-Pro、MiMo-V2.5-TTS Series及MiMo-V2.5-ASR，覆盖文本对话、语音合成与语音识别三大模态。其中，旗舰型号MiMo-V2.5-Pro与通用型号MiMo-V2.5将面向全球开源。开发者可通过MiMo开放平台接入API，或在MiMo Studio进行体验。

MiMo-V2.5-Pro定位为“为长难Agent任务而生”，支持100万Token上下文长度，在通用智能体能力、复杂软件工程及长程任务等维度上对标Claude Opus 4.6与GPT-5.4等全球头部AI模型。内部测试显示，配合运行框架后该AI模型可稳定完成单次近千轮工具调用的长周期任务，并在复杂指令解析与跨步骤逻辑一致性方面显著提升。实际案例中，北京大学《编译原理》课程项目要求学生用Rust实现完整SysY编译器，本科生通常需数周完成，MiMo-V2.5-Pro仅耗时4.3小时、经672次工具调用即完成全部开发，在隐藏测试集取得233分满分。另一案例中，该AI模型根据“构建一个视频编辑器Web应用”的简短指令，交付了具备多轨道时间线、片段裁剪、交叉淡化及音频混合等功能的可运行应用，代码量达8192行，历时1868次工具调用、11.5小时自主完成。

MiMo-V2.5主打原生全模态Agent能力，全面支持图像、音频与视频输入，推理速度更快，同样支持100万Token上下文。在Claw-Eval等主流Agent评测中，综合表现超越上一代MiMo-V2-Pro，API成本降低约50%。跨模态推理、视频理解与图表分析等能力在VideoMME、CharXiv、MMMU-Pro等评测中逼近甚至超越业界顶级闭源AI模型。语音合成方面，V2.5-TTS Series基于自研Audio Tokenizer与多码本语音-文本联合建模架构，经过上亿小时语音数据的大规模预训练和多维度强化学习，具备高度可控的多粒度语音风格控制能力。

Token效率优化是本次升级的另一核心亮点。在相同ClawEval基准分数下，MiMo-V2.5-Pro相比Kimi K2.6节省42% Token消耗，MiMo-V2.5相较Muse Spark节省50% Token。Token Plan定价方案同步调整：取消原有1 Token=4 Credits的计费方式，不再区分256K与1M上下文窗口的Credit倍率;新增连续包月与包年订阅模式。北京时间每日0时至8时，所有AI模型Credits消耗速率在原有基础上再打8折。Token Plan提供四档月度套餐，Lite套餐39元/月提供0.6亿Credits，最高档659元/月提供16亿Credits。

小米大模型负责人罗福莉此前在2026中关村论坛表示，团队首款专为Agent时代打造的全栈AI产品因技术迭代速度过快，发布更像“悄无声息的伏击”，并强调AI模型开源需满足“足够稳定且值得开源”的条件以保障开发者体验。该负责人同时透露，OpenClaw等框架的成熟拉高了部分接近闭源AI模型的上限，Agent能力已成为衡量大模型实用性的关键标尺。小米于2025年4月首次开源专为推理优化的AI模型Xiaomi MiMo，同年12月发布并开源升级版本MiMo-V2-Flash，2026年3月推出面向智能体时代的旗舰基座AI模型MiMo-V2-Pro。此次V2.5系列的发布延续了小米在开源Agent大模型领域的技术积累与产品节奏。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国