中国电信发布TeleChat3 ,AI模型展现技术自主新路径
2026-01-21 10:40
收藏

中国电信旗下人工智能研究机构TeleAI近日发布TeleChat3系列大型语言模型,这是中国首个完全基于国产半导体训练的大规模混合专家(MoE)模型。该模型训练全程采用华为昇腾910B AI芯片与开源MindSpore框架,验证了中国技术栈支持前沿规模模型开发的可行性。

TeleChat3产品线包含旗舰模型TeleChat3-105B-A4.7B-Thinking与密集架构的TeleChat3-36B-Thinking。前者采用细粒度MoE架构,总参数达1050亿,但单次推理仅激活47亿参数,在保证高性能的同时降低计算开销。训练在上海临港的计算基础设施完成,消耗15万亿代币数据,系统运行于华为昇腾Atlas800T A2训练服务器,与昇腾生态系统完全兼容。中国电信强调,华为硬件能满足大规模教育领域训练的严苛要求,但具体训练效率与性能对比数据尚未公开。

模型核心创新在于“思考模式”功能。通过对话模板中的引导符号,模型可生成中间推理步骤并展示思维过程,类似“思维导图”技术但被定位为架构级功能。中国电信称,该模式在知识问答、数学推理、代码生成等复杂任务中表现突出,六个核心维度性能接近国际先进水平。不过,由于缺乏与GPT-5或Claude的直接基准测试,第三方评估仍需时间验证。

作为中国“人工智能+”计划的一部分,TeleChat3提供了一种避免依赖外国技术的国产模式。与其他项目不同,中国电信已将模型权重、推理代码及使用示例开源至GitHub与ModelScope平台,为学术研究与商业开发提供便利。这一举措能否推动模型在国际市场获得关注,仍有待后续发展。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com