中国智谱AI发布开放权重GLM5.2挑战付费模式

2026-06-24 11:35

关键词:

维度网讯，Z.ai（前身为智谱AI）发布了名为GLM 5.2的开放权重AI模型，该模型可下载、定制并完全在本地设备上运行，此举挑战了业界关于高端AI性能只能通过向科技巨头支付高级订阅费才能获取的普遍看法。

与ChatGPT或Claude等封闭系统不同，GLM 5.2为开发者提供了直接访问模型本身的权限。在日益由封闭的企业服务器主导的行业中，这一特性赋予了用户更大的控制权。Z.ai指出，随着Meta的Llama系列、Mistral以及GLM 5.2等模型的涌现，高端AI与开放模型之间的差距正在迅速缩小。许多企业并不需要解决世界级理论逻辑问题的模型，它们更需要一个能够准确总结大型内部文档库，或自主编写和调试代码的系统。如果开放模型能以低得多的成本完成这些工作的90%到95%，这类模型便不容忽视。

当开发者成功演示GLM 5.2在Mac mini等高端苹果设备上本地运行时，其关注度快速提升。这一演示证明，强大的AI现在可以“拥有”，而不仅仅是“订阅租赁”。对于依赖订阅的模式，第三方控制着价格、隐私政策和功能路线图，而开放权重模型扭转了这一局面。对于处理敏感财务数据、医疗记录或专有企业研究的行业而言，将数据完全保留在内部硬件上是显著的安全优势。未来企业技术栈更可能呈现为“混合”AI堆栈：封闭的旗舰模型处理最难的推理问题；开放权重模型驱动高容量常规工作流；本地托管模型安全管理最机密的内部数据。

GLM 5.2是一个庞大的混合专家（MoE）模型，拥有7440亿至7530亿个参数。在未压缩形式下，其权重消耗1.51 TB的存储和内存。标准高端PC最大VRAM为24GB，面临“VRAM墙”；Mac Studio最大统一内存为256GB，可以运行高度压缩的版本。要在本地运行GLM 5.2，开发者必须使用量化技术进行激进压缩。即使经过重度压缩，该模型仅加载就需要约240GB内存。此外，GLM 5.2拥有与Claude相同的100万token上下文窗口，这意味着它可以一次性消化整个代码库或小型图书馆的书籍。但跟踪如此大量的数据需要专门的内存分配，将模型推向极限时，即使最强大的消费级桌面也会开始过热。

对于非编程人员而言，这一新闻依旧相关。AI正在从根本上改变着每天使用的软件。GLM 5.2不会在明天就取代手机上的应用，但它突显了开放模型正变得更便宜且极具竞争力。随着软件公司获得更多选择，不再需要向单一供应商支付高昂费用来为其应用添加AI功能，这一变化可能意味着下一代数字工具将更便宜、高度专业化且隐私性更强。像GLM 5.2这样的开放AI模型不仅是替代品，更是对昂贵订阅模式的重要挑战，为企业和开发者提供了构建更高效、更安全且更实惠解决方案的机会。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国