小米AI模型MiMo-V2.5系列公测,Pro版性能对标GPT-5.4并开源
2026-04-23 09:05
收藏

维度网讯,小米于4月23日宣布其AI模型Xiaomi MiMo-V2.5系列正式开启公测。该系列共推出四款AI模型:MiMo-V2.5、MiMo-V2.5-Pro、MiMo-V2.5-TTS Series及MiMo-V2.5-ASR,覆盖文本对话、语音合成与语音识别三大模态。其中,旗舰型号MiMo-V2.5-Pro与通用型号MiMo-V2.5将面向全球开源。开发者可通过MiMo开放平台接入API,或在MiMo Studio进行体验。

MiMo-V2.5-Pro定位为“为长难Agent任务而生”,支持100万Token上下文长度,在通用智能体能力、复杂软件工程及长程任务等维度上对标Claude Opus 4.6与GPT-5.4等全球头部AI模型。内部测试显示,配合运行框架后该AI模型可稳定完成单次近千轮工具调用的长周期任务,并在复杂指令解析与跨步骤逻辑一致性方面显著提升。实际案例中,北京大学《编译原理》课程项目要求学生用Rust实现完整SysY编译器,本科生通常需数周完成,MiMo-V2.5-Pro仅耗时4.3小时、经672次工具调用即完成全部开发,在隐藏测试集取得233分满分。另一案例中,该AI模型根据“构建一个视频编辑器Web应用”的简短指令,交付了具备多轨道时间线、片段裁剪、交叉淡化及音频混合等功能的可运行应用,代码量达8192行,历时1868次工具调用、11.5小时自主完成。

MiMo-V2.5主打原生全模态Agent能力,全面支持图像、音频与视频输入,推理速度更快,同样支持100万Token上下文。在Claw-Eval等主流Agent评测中,综合表现超越上一代MiMo-V2-Pro,API成本降低约50%。跨模态推理、视频理解与图表分析等能力在VideoMME、CharXiv、MMMU-Pro等评测中逼近甚至超越业界顶级闭源AI模型。语音合成方面,V2.5-TTS Series基于自研Audio Tokenizer与多码本语音-文本联合建模架构,经过上亿小时语音数据的大规模预训练和多维度强化学习,具备高度可控的多粒度语音风格控制能力。

Token效率优化是本次升级的另一核心亮点。在相同ClawEval基准分数下,MiMo-V2.5-Pro相比Kimi K2.6节省42% Token消耗,MiMo-V2.5相较Muse Spark节省50% Token。Token Plan定价方案同步调整:取消原有1 Token=4 Credits的计费方式,不再区分256K与1M上下文窗口的Credit倍率;新增连续包月与包年订阅模式。北京时间每日0时至8时,所有AI模型Credits消耗速率在原有基础上再打8折。Token Plan提供四档月度套餐,Lite套餐39元/月提供0.6亿Credits,最高档659元/月提供16亿Credits。

小米大模型负责人罗福莉此前在2026中关村论坛表示,团队首款专为Agent时代打造的全栈AI产品因技术迭代速度过快,发布更像“悄无声息的伏击”,并强调AI模型开源需满足“足够稳定且值得开源”的条件以保障开发者体验。该负责人同时透露,OpenClaw等框架的成熟拉高了部分接近闭源AI模型的上限,Agent能力已成为衡量大模型实用性的关键标尺。小米于2025年4月首次开源专为推理优化的AI模型Xiaomi MiMo,同年12月发布并开源升级版本MiMo-V2-Flash,2026年3月推出面向智能体时代的旗舰基座AI模型MiMo-V2-Pro。此次V2.5系列的发布延续了小米在开源Agent大模型领域的技术积累与产品节奏。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com