美国xAI完成Grok V9-Medium训练,1.5T基础模型把复杂编程任务列为升级重点
2026-05-26 08:38
收藏

维度网讯,5月25日,马斯克宣布,Grok基础模型V9-Medium已经完成训练,模型规模为1.5万亿参数,当前评测结果表现良好。其称,补充训练阶段加入了大量Cursor相关数据,后续还会继续引入更多数据;模型目前正在进行微调,几天后将启动强化学习,预计2至3周内面向公众发布。

这次披露把xAI下一代Grok模型的升级方向进一步指向软件工程场景。马斯克表示,V9-Medium将相较目前支撑Grok全部生产线流量的0.5万亿参数v8-small版本形成明显提升,尤其是在处理复杂编程任务方面。参数规模从0.5T提高到1.5T,意味着模型容量、上下文信息压缩、代码模式学习和复杂任务拆解能力可能获得更大空间,但最终效果仍取决于微调、强化学习、工具调用、数据质量和实际应用反馈,不能只用参数规模直接推导模型能力。

Cursor相关数据被纳入补充训练,是这条消息中最能体现产品方向的部分。Cursor是开发者使用频率较高的AI编程工具,围绕代码补全、项目理解、重构、调试和多文件协作形成了大量软件工程场景。马斯克没有披露这部分数据的具体来源、授权边界、样本规模、清洗方式或任务类型,因此目前只能将其理解为xAI正在强化Grok对真实编程工作流的适配,而不能扩写为已经获得Cursor官方合作、收购完成或独家数据协议。

xAI近期也在产品侧强化编程入口。公司日前推出Grok Build早期测试版,将其定义为面向专业软件工程和复杂编码工作的终端式编程智能体,可在命令行环境中运行,并支持规划、代码修改、差异查看和任务执行等工作流。Grok V9-Medium如果按计划在2至3周内发布,将与Grok Build这类开发者工具形成更直接的能力衔接,使模型不只承担对话问答,还要进入代码仓库、任务规划、工具调用和多步骤工程执行环节。

编程能力正在成为前沿模型竞争的核心场景之一。OpenAI、Anthropic、Google、xAI等模型厂商都在把代码生成、代码审查、测试生成、软件代理、命令行工具和企业开发工作流作为高频应用入口。与普通聊天场景相比,复杂编程任务对模型的长程规划、文件级理解、依赖关系判断、错误定位、执行反馈和安全约束要求更高。Grok V9-Medium后续强化学习阶段的表现,将直接影响其能否在真实项目中减少无效改动、降低幻觉代码、提升调试效率,并稳定接入开发者工具链。

这款模型仍未正式发布,关键变量集中在微调质量、强化学习结果、公开版本名称、订阅或API开放范围、上下文长度、代码工具调用能力、推理成本和线上稳定性。现阶段可确认的信息是:Grok V9-Medium已完成训练,参数规模为1.5T,马斯克称评测结果良好,并预计2至3周内公开发布;尚不能写成模型已上线、性能已被第三方基准全面验证,或已经替换当前Grok生产流量。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com