alphaXiv采用中国开源模型GLM-5.2替代受限的Claude模型

2026-06-23 09:17

关键词:

维度网讯，alphaXiv的自动研究员演示中首次采用中国开源模型GLM-5.2，替代此前因美国当局限制而无法访问的Anthropic公司前沿模型——Claude Fable 5和Mythos 5。alphaXiv团队明确表示，这只是自身的演示活动，并非独立测试；选择开源替代品的原因是前沿模型被封闭于研究之外，开源社区因此寻求可替代方案。

在展示的运行中，GLM-5.2自行完成了两种强化学习训练方案的对比——完全异步方案与合并同步方案。实验在两节点上各搭载八块H100加速器，基于SkyRL框架，在Harbor代码竞赛任务集上进行。团队描述指出，该智能体自行修复了环境问题（libnuma依赖），完成了所有运行，并汇总了吞吐量和奖励稳定性的最终对比数据。

alphaXiv的自动研究员功能用于解决论文代码的可复现性问题。用户将论文地址中的arxiv改为autoarxiv后，智能体便会自动部署仓库、修复环境、运行最小可复现性检查，并评估完全复现结果的成本。这一过程涉及工程环节——搭建并验证他人代码，而非科学发现。对于私有代码，另有独立平台OpenResearch.sh。

GLM-5.2来自中国Z.ai（原智谱AI），是一款采用MoE架构的开源模型，约7500亿参数，每个token激活约400亿参数，上下文长度100万token，采用MIT许可证。团队指出，该模型的关键特性并非基准测试成绩，而是其开源权重无法被监管机构撤销——这对于需要可预测访问的工具而言是一种保障。

alphaXiv团队坦承，GLM-5.2缺乏视觉能力：当其他模型直接从WandB（实验跟踪服务）的图表中读取趋势时，GLM则编写numpy代码解析原始数字——对于简单运行足够，但在复杂任务上反而会碍事。团队表示，当前阶段的模型尚未真正开展研究，其优势在于解决实现问题以及复现已有工作。此处的自主研究指的是实验的工程周期，而非科学发现。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国