月之暗面（Moonshot AI）Kimi K2.6发布并开源，代码评测较上一代提升20%

2026-04-21 09:10

关键词:

维度网讯，月之暗面（Moonshot AI）于4月20日晚发布并开源新一代旗舰模型Kimi K2.6。据月之暗面官方微信公众号消息，该模型在通用Agent、代码生成及视觉理解等综合能力上全面提升，多项权威基准测试表现优于或持平GPT-5.4、Claude Opus 4.6及Gemini 3.1 Pro。Kimi K2.6现已上线kimi.com、最新版Kimi应用、Kimi API及Kimi Code编程助手，所有用户均可使用。

K2.6是月之暗面迄今最强的代码模型，长程编码能力显著提升。内部代码评测基准Kimi Code Bench数据显示，K2.6成绩较上一代K2.5提升约20%。在SWE-Bench Pro真实软件工程能力测试中，K2.6得分58.6分，高于GPT-5.4 xhigh的57.7分、Gemini 3.1 Pro的54.2分及Claude Opus 4.6的53.4分。完整版人类最后的考试带工具测试中，K2.6得分54.0分，三款主流闭源模型均低于此分数。Terminal-Bench 2.0评测中K2.6得分66.7分，仅次于Gemini 3.1 Pro的68.5分。实际应用场景下K2.6可连续13小时编写或修改超过4000行代码，并将代码与视觉能力深度融合以交付专业级Web应用。

K2.6驱动的Agent集群架构支持最多300个子Agent并行运行，执行约4000个协作步骤，一次性完成从文档到网页、PPT和表格的多产物端到端交付。针对Agent编排能力的BrowseComp Agent Swarm测试中，K2.6得分86.3分，GPT-5.4为78.4分。面向高负载工作流及OpenClaw、Hermes Agent等主动式Agent框架，K2.6支持长达5天的持续自主运行。月之暗面内部强化学习基础设施团队已使用K2.6驱动Agent连续自主运行5天，负责监控、故障响应和系统运维。内部Claw Bench测试结果显示K2.6相比K2.5综合性能提升10%。

K2.6延续K2.5的混合专家架构，总参数量1万亿，激活参数量320亿，包含384个专家，每个token激活8个专家，上下文长度256K，原生支持图片和视频输入。Mac本地部署实测中，K2.6通过Zig语言优化推理流程，在4000余次工具调用、12小时连续运行中将吞吐量从约15tokens每秒提升至约193tokens每秒，推理效率较LM Studio快约20%。另一项测试中K2.6自主完成对8年历史开源金融撮合引擎exchange-core的深度重构，历经13小时连续作业、1000余次工具调用，修改4000余行代码并重构核心线程拓扑，实现185%的中位吞吐量提升。

Kimi Code编程助手已推出每月39元起的会员计划。Kimi Agent模式支持创建和调用技能，系统已内置上百个官方推荐技能，包含投研技能包等。K2.6的全面开源进一步巩固了国产大模型在开源社区的影响力，也为月之暗面此前被披露正在评估的港股IPO计划及新一轮约10亿美元融资提供了产品实力支撑。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国