维度网讯,6月10日,中国国产GPU企业摩尔线程宣布发布并开源MusaCoder。这是一款面向GPU底层算子生成的专用代码大模型,能够根据PyTorch参考实现生成CUDA和MUSA原生GPU Kernel,重点服务高性能计算、AI训练推理优化和国产GPU软件生态建设。
GPU底层算子是AI框架和硬件性能之间的关键连接层。大模型训练、推理、科学计算和图形处理都需要大量矩阵计算、张量变换、归约、访存优化和并行调度操作,如果底层算子效率不足,上层模型即便参数规模扩大,也难以充分释放GPU算力。过去,算子开发高度依赖工程师手写和反复调优,对硬件架构、并行编程、内存层级和编译工具链都有较高要求。MusaCoder的发布,瞄准的正是这一高门槛环节,希望用专用代码大模型提高底层算子生成效率。
这项开源成果的特殊之处,在于其完整后训练流程均在基于MTT S5000构建的夸娥智算集群上完成。摩尔线程介绍,MusaCoder是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型。
MusaCoder采用面向Kernel生成的训练框架,结合数据合成、拒绝微调和执行反馈强化学习等方法,让模型在生成代码后能够通过编译、数值正确性和实际加速效果进行验证。GPU算子生成不同于普通代码补全,代码能否运行只是第一步,更关键的是能否在指定硬件后端上稳定编译、结果正确、没有非法回退,并在真实执行中获得性能提升。摩尔线程此次把MUSA后端纳入训练和验证流程,意味着模型不仅服务通用CUDA生态,也直接面向国产GPU并行计算环境。
对国产GPU产业而言,MusaCoder的意义不只是一款开源模型。国产AI算力要进入更多开发者和企业项目,必须解决软件生态适配问题,包括深度学习框架、算子库、编译器、通信库、推理引擎和应用模型迁移。底层算子生成能力提升后,开发者可以更快把高层张量程序转化为可执行、可优化的GPU代码,减少人工迁移和性能调试成本。对于需要适配国产GPU的模型厂商、科研机构和行业应用团队来说,这类工具可以缩短从代码移植到性能验证的周期。
产业链影响将集中在国产GPU开发工具、AI框架适配、模型训练优化和智算中心软件服务等环节。随着大模型进入更深层的工程化阶段,算力竞争不再只看单卡峰值参数,还要看软件栈能否支撑模型稳定训练、推理部署和性能调优。MusaCoder若能持续迭代并获得开发者使用,将有助于摩尔线程MUSA生态积累更多算子、样例和优化经验,也会增强夸娥智算集群在大模型训练和代码生成类任务中的验证价值。后续节点包括模型权重下载使用情况、开发者反馈、MUSA后端适配范围扩大,以及该模型能否在更多AI框架和行业算子场景中形成实用效果。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









