维度网讯,中国AI初创公司Z.ai(又称筑派AI)今日发布了GLM-5.1开源大模型,采用MIT许可证,允许企业下载、定制并商业使用。该模型设计为能在单个任务上自主工作长达八小时,标志着从编码向代理工程的转变。

GLM-5.1拥有7540亿参数,旨在维持跨越数千次工具调用的扩展执行轨迹中的目标对齐。Z.ai负责人Lou在X上写道:“到去年年底,代理大约能做20步,glm-5.1现在能做1700步。自主工作时间可能是扩展定律之后最重要的曲线。glm-5.1将是开源社区可以亲手验证的该曲线上的第一个点。”该模型通过阶梯模式运行,避免平台效应,在VectorDBBench挑战中优化向量数据库,从每秒3,547次查询提升至21,500次查询,展示了自主实验和优化能力。
在SWE-Bench Pro基准测试中,GLM-5.1获得58.4分,超过GPT-5.4的57.7分和Claude Opus 4.6的57.3分。它还展示了在八小时内从零构建Linux风格桌面环境的能力,包括文件浏览器、终端和功能性游戏。Z.ai将GLM-5.1集成到Coding Plan生态系统,提供三个订阅层级,API定价为每百万输入令牌1.40美元,输出令牌4.40美元。同时,GLM-5 Turbo作为专有版本针对快速推理优化,成本为每百万输入1.20美元,输出4美元。
GLM-5.1的发布反映了AI市场趋势,开源模型用于广泛分发,而执行优化变体保持专有。开发者社区反馈积极,用户报告效率提升,例如一项原需一周的任务现仅两天完成。Z.ai表示,AI竞争前沿正转向自主持续时间,GLM-5.1作为工程级工具,与Claude Code等开发者工具兼容,有望改变软件开发生命周期。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告之,本站将予以修改或删除。邮箱:news@wedoany.com









