维度网讯,2026年5月9日,百度正式发布新一代基础大模型文心大模型5.1。该模型采用“多维弹性预训练”技术,将总参数压缩至文心5.0的约三分之一、激活参数压缩至约二分之一,预训练成本仅为业界同规模模型的约6%,目前已登陆LMArena搜索榜国内第一、全球第四,同步在百度千帆模型广场和文心一言官网上线。
与单纯追求参数规模的行业主流路径不同,文心5.1的技术突破集中于训练效率维度的结构性革新。百度研发团队在文心5.0发布时首次提出“Once-for-All”弹性训练框架,其核心逻辑是在单次预训练过程中,通过动态采样机制同时优化大量参数各异的子模型,构建覆盖多种参数规模与计算开销的“子模型矩阵”。文心5.1正是从这一子模型矩阵中提取最优子网络架构,完整继承文心5.0的知识储备,同时实现参数效率与训练成本的跨越式优化。
从技术细节看,弹性训练框架在三个维度上实现了弹性压缩与扩展。弹性深度方面,训练时随机跳过部分Transformer层,使不同深度的子模型共享权重,自适应学习深层与浅层表征的平衡;弹性宽度方面,通过动态屏蔽MoE层的部分专家,迫使剩余专家承担更多样化的任务,提升专家利用效率;弹性稀疏度方面,通过可变Top-k路由机制灵活调整激活的专家数量——激活较少专家时降低推理成本,激活更多专家时则增强模型能力,实现推理开销与性能之间的动态平衡。
多项权威基准测试验证了文心5.1的性能水平。智能体能力方面,在τ³-bench与SpreadsheetBench-Verified评测任务中,文心5.1性能超越DeepSeek-V4-Pro,Agentic能力已接近国际领先闭源模型。推理能力方面,在AIME26数学竞赛评测(使用工具)中得分99.6,仅次于Gemini 3.1 Pro。创意写作能力方面,内部评测显示已接近Gemini 3.1 Pro。世界知识与知识理解方面,GPQA和MMLU-Pro评测表现接近领先闭源模型。
为推动大模型向自主决策智能体进化,百度同步构建了分离式全异步强化学习基础技术,针对性解决训推偏差、资源利用率低及长尾效应带来的全局优化挑战。通过规模化智能体后训练与环境-专家-融合全链路协同策略,模型在处理复杂长尾任务时保持稳定表现。搜索能力方面,文心5.1可对多源信息进行快速检索、整合与生成,输出一致性更强、可靠性更高的回答,在内容创作、智能助手、企业知识管理和智能体应用等复杂业务场景中具备较高的实用价值。
在此之前,文心5.0系列已多次登上LMArena文本榜与视觉理解榜,稳居国产模型第一梯队。4月30日,文心5.1 Preview版本曾以1476分登上LMArena文本榜国内第一,超越GPT-5.5、DeepSeek-V4-Pro等主流模型,为榜单前十五名中唯一入围的国产模型。Create 2026百度AI开发者大会将于5月13日至14日在北京国家会议中心二期举办,百度将在大会上围绕文心大模型发布AI技术突破与产业落地的最新进展。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com










