中国电信发布TeleChat3 ，AI模型展现技术自主新路径

2026-01-21 10:40

关键词:

中国电信旗下人工智能研究机构TeleAI近日发布TeleChat3系列大型语言模型，这是中国首个完全基于国产半导体训练的大规模混合专家(MoE)模型。该模型训练全程采用华为昇腾910B AI芯片与开源MindSpore框架，验证了中国技术栈支持前沿规模模型开发的可行性。

TeleChat3产品线包含旗舰模型TeleChat3-105B-A4.7B-Thinking与密集架构的TeleChat3-36B-Thinking。前者采用细粒度MoE架构，总参数达1050亿，但单次推理仅激活47亿参数，在保证高性能的同时降低计算开销。训练在上海临港的计算基础设施完成，消耗15万亿代币数据，系统运行于华为昇腾Atlas800T A2训练服务器，与昇腾生态系统完全兼容。中国电信强调，华为硬件能满足大规模教育领域训练的严苛要求，但具体训练效率与性能对比数据尚未公开。

模型核心创新在于“思考模式”功能。通过对话模板中的引导符号，模型可生成中间推理步骤并展示思维过程，类似“思维导图”技术但被定位为架构级功能。中国电信称，该模式在知识问答、数学推理、代码生成等复杂任务中表现突出，六个核心维度性能接近国际先进水平。不过，由于缺乏与GPT-5或Claude的直接基准测试，第三方评估仍需时间验证。

作为中国“人工智能+”计划的一部分，TeleChat3提供了一种避免依赖外国技术的国产模式。与其他项目不同，中国电信已将模型权重、推理代码及使用示例开源至GitHub与ModelScope平台，为学术研究与商业开发提供便利。这一举措能否推动模型在国际市场获得关注，仍有待后续发展。

中国