中国智谱AI发布开放权重GLM5.2挑战付费模式
2026-06-24 11:35
收藏

维度网讯,Z.ai(前身为智谱AI)发布了名为GLM 5.2的开放权重AI模型,该模型可下载、定制并完全在本地设备上运行,此举挑战了业界关于高端AI性能只能通过向科技巨头支付高级订阅费才能获取的普遍看法。

与ChatGPT或Claude等封闭系统不同,GLM 5.2为开发者提供了直接访问模型本身的权限。在日益由封闭的企业服务器主导的行业中,这一特性赋予了用户更大的控制权。Z.ai指出,随着Meta的Llama系列、Mistral以及GLM 5.2等模型的涌现,高端AI与开放模型之间的差距正在迅速缩小。许多企业并不需要解决世界级理论逻辑问题的模型,它们更需要一个能够准确总结大型内部文档库,或自主编写和调试代码的系统。如果开放模型能以低得多的成本完成这些工作的90%到95%,这类模型便不容忽视。

当开发者成功演示GLM 5.2在Mac mini等高端苹果设备上本地运行时,其关注度快速提升。这一演示证明,强大的AI现在可以“拥有”,而不仅仅是“订阅租赁”。对于依赖订阅的模式,第三方控制着价格、隐私政策和功能路线图,而开放权重模型扭转了这一局面。对于处理敏感财务数据、医疗记录或专有企业研究的行业而言,将数据完全保留在内部硬件上是显著的安全优势。未来企业技术栈更可能呈现为“混合”AI堆栈:封闭的旗舰模型处理最难的推理问题;开放权重模型驱动高容量常规工作流;本地托管模型安全管理最机密的内部数据。

GLM 5.2是一个庞大的混合专家(MoE)模型,拥有7440亿至7530亿个参数。在未压缩形式下,其权重消耗1.51 TB的存储和内存。标准高端PC最大VRAM为24GB,面临“VRAM墙”;Mac Studio最大统一内存为256GB,可以运行高度压缩的版本。要在本地运行GLM 5.2,开发者必须使用量化技术进行激进压缩。即使经过重度压缩,该模型仅加载就需要约240GB内存。此外,GLM 5.2拥有与Claude相同的100万token上下文窗口,这意味着它可以一次性消化整个代码库或小型图书馆的书籍。但跟踪如此大量的数据需要专门的内存分配,将模型推向极限时,即使最强大的消费级桌面也会开始过热。

对于非编程人员而言,这一新闻依旧相关。AI正在从根本上改变着每天使用的软件。GLM 5.2不会在明天就取代手机上的应用,但它突显了开放模型正变得更便宜且极具竞争力。随着软件公司获得更多选择,不再需要向单一供应商支付高昂费用来为其应用添加AI功能,这一变化可能意味着下一代数字工具将更便宜、高度专业化且隐私性更强。像GLM 5.2这样的开放AI模型不仅是替代品,更是对昂贵订阅模式的重要挑战,为企业和开发者提供了构建更高效、更安全且更实惠解决方案的机会。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com