月之暗面(Moonshot AI)Kimi K2.6发布并开源,代码评测较上一代提升20%
2026-04-21 09:10
收藏

维度网讯,月之暗面(Moonshot AI)于4月20日晚发布并开源新一代旗舰模型Kimi K2.6。据月之暗面官方微信公众号消息,该模型在通用Agent、代码生成及视觉理解等综合能力上全面提升,多项权威基准测试表现优于或持平GPT-5.4、Claude Opus 4.6及Gemini 3.1 Pro。Kimi K2.6现已上线kimi.com、最新版Kimi应用、Kimi API及Kimi Code编程助手,所有用户均可使用。

K2.6是月之暗面迄今最强的代码模型,长程编码能力显著提升。内部代码评测基准Kimi Code Bench数据显示,K2.6成绩较上一代K2.5提升约20%。在SWE-Bench Pro真实软件工程能力测试中,K2.6得分58.6分,高于GPT-5.4 xhigh的57.7分、Gemini 3.1 Pro的54.2分及Claude Opus 4.6的53.4分。完整版人类最后的考试带工具测试中,K2.6得分54.0分,三款主流闭源模型均低于此分数。Terminal-Bench 2.0评测中K2.6得分66.7分,仅次于Gemini 3.1 Pro的68.5分。实际应用场景下K2.6可连续13小时编写或修改超过4000行代码,并将代码与视觉能力深度融合以交付专业级Web应用。

K2.6驱动的Agent集群架构支持最多300个子Agent并行运行,执行约4000个协作步骤,一次性完成从文档到网页、PPT和表格的多产物端到端交付。针对Agent编排能力的BrowseComp Agent Swarm测试中,K2.6得分86.3分,GPT-5.4为78.4分。面向高负载工作流及OpenClaw、Hermes Agent等主动式Agent框架,K2.6支持长达5天的持续自主运行。月之暗面内部强化学习基础设施团队已使用K2.6驱动Agent连续自主运行5天,负责监控、故障响应和系统运维。内部Claw Bench测试结果显示K2.6相比K2.5综合性能提升10%。

K2.6延续K2.5的混合专家架构,总参数量1万亿,激活参数量320亿,包含384个专家,每个token激活8个专家,上下文长度256K,原生支持图片和视频输入。Mac本地部署实测中,K2.6通过Zig语言优化推理流程,在4000余次工具调用、12小时连续运行中将吞吐量从约15tokens每秒提升至约193tokens每秒,推理效率较LM Studio快约20%。另一项测试中K2.6自主完成对8年历史开源金融撮合引擎exchange-core的深度重构,历经13小时连续作业、1000余次工具调用,修改4000余行代码并重构核心线程拓扑,实现185%的中位吞吐量提升。

Kimi Code编程助手已推出每月39元起的会员计划。Kimi Agent模式支持创建和调用技能,系统已内置上百个官方推荐技能,包含投研技能包等。K2.6的全面开源进一步巩固了国产大模型在开源社区的影响力,也为月之暗面此前被披露正在评估的港股IPO计划及新一轮约10亿美元融资提供了产品实力支撑。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com