alphaXiv采用中国开源模型GLM-5.2替代受限的Claude模型
2026-06-23 09:17
收藏

维度网讯,alphaXiv的自动研究员演示中首次采用中国开源模型GLM-5.2,替代此前因美国当局限制而无法访问的Anthropic公司前沿模型——Claude Fable 5和Mythos 5。alphaXiv团队明确表示,这只是自身的演示活动,并非独立测试;选择开源替代品的原因是前沿模型被封闭于研究之外,开源社区因此寻求可替代方案。

在展示的运行中,GLM-5.2自行完成了两种强化学习训练方案的对比——完全异步方案与合并同步方案。实验在两节点上各搭载八块H100加速器,基于SkyRL框架,在Harbor代码竞赛任务集上进行。团队描述指出,该智能体自行修复了环境问题(libnuma依赖),完成了所有运行,并汇总了吞吐量和奖励稳定性的最终对比数据。

alphaXiv的自动研究员功能用于解决论文代码的可复现性问题。用户将论文地址中的arxiv改为autoarxiv后,智能体便会自动部署仓库、修复环境、运行最小可复现性检查,并评估完全复现结果的成本。这一过程涉及工程环节——搭建并验证他人代码,而非科学发现。对于私有代码,另有独立平台OpenResearch.sh。

GLM-5.2来自中国Z.ai(原智谱AI),是一款采用MoE架构的开源模型,约7500亿参数,每个token激活约400亿参数,上下文长度100万token,采用MIT许可证。团队指出,该模型的关键特性并非基准测试成绩,而是其开源权重无法被监管机构撤销——这对于需要可预测访问的工具而言是一种保障。

alphaXiv团队坦承,GLM-5.2缺乏视觉能力:当其他模型直接从WandB(实验跟踪服务)的图表中读取趋势时,GLM则编写numpy代码解析原始数字——对于简单运行足够,但在复杂任务上反而会碍事。团队表示,当前阶段的模型尚未真正开展研究,其优势在于解决实现问题以及复现已有工作。此处的自主研究指的是实验的工程周期,而非科学发现。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com