中国百度发布文心大模型5.1，预训练成本仅为业界6%

2026-05-09 16:09

关键词:

维度网讯，2026年5月9日，百度正式发布新一代基础大模型文心大模型5.1。该模型采用“多维弹性预训练”技术，将总参数压缩至文心5.0的约三分之一、激活参数压缩至约二分之一，预训练成本仅为业界同规模模型的约6%，目前已登陆LMArena搜索榜国内第一、全球第四，同步在百度千帆模型广场和文心一言官网上线。

与单纯追求参数规模的行业主流路径不同，文心5.1的技术突破集中于训练效率维度的结构性革新。百度研发团队在文心5.0发布时首次提出“Once-for-All”弹性训练框架，其核心逻辑是在单次预训练过程中，通过动态采样机制同时优化大量参数各异的子模型，构建覆盖多种参数规模与计算开销的“子模型矩阵”。文心5.1正是从这一子模型矩阵中提取最优子网络架构，完整继承文心5.0的知识储备，同时实现参数效率与训练成本的跨越式优化。

从技术细节看，弹性训练框架在三个维度上实现了弹性压缩与扩展。弹性深度方面，训练时随机跳过部分Transformer层，使不同深度的子模型共享权重，自适应学习深层与浅层表征的平衡;弹性宽度方面，通过动态屏蔽MoE层的部分专家，迫使剩余专家承担更多样化的任务，提升专家利用效率;弹性稀疏度方面，通过可变Top-k路由机制灵活调整激活的专家数量——激活较少专家时降低推理成本，激活更多专家时则增强模型能力，实现推理开销与性能之间的动态平衡。

多项权威基准测试验证了文心5.1的性能水平。智能体能力方面，在τ³-bench与SpreadsheetBench-Verified评测任务中，文心5.1性能超越DeepSeek-V4-Pro，Agentic能力已接近国际领先闭源模型。推理能力方面，在AIME26数学竞赛评测(使用工具)中得分99.6，仅次于Gemini 3.1 Pro。创意写作能力方面，内部评测显示已接近Gemini 3.1 Pro。世界知识与知识理解方面，GPQA和MMLU-Pro评测表现接近领先闭源模型。

为推动大模型向自主决策智能体进化，百度同步构建了分离式全异步强化学习基础技术，针对性解决训推偏差、资源利用率低及长尾效应带来的全局优化挑战。通过规模化智能体后训练与环境-专家-融合全链路协同策略，模型在处理复杂长尾任务时保持稳定表现。搜索能力方面，文心5.1可对多源信息进行快速检索、整合与生成，输出一致性更强、可靠性更高的回答，在内容创作、智能助手、企业知识管理和智能体应用等复杂业务场景中具备较高的实用价值。

在此之前，文心5.0系列已多次登上LMArena文本榜与视觉理解榜，稳居国产模型第一梯队。4月30日，文心5.1 Preview版本曾以1476分登上LMArena文本榜国内第一，超越GPT-5.5、DeepSeek-V4-Pro等主流模型，为榜单前十五名中唯一入围的国产模型。Create 2026百度AI开发者大会将于5月13日至14日在北京国家会议中心二期举办，百度将在大会上围绕文心大模型发布AI技术突破与产业落地的最新进展。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国