中国电信发布TeleChat3 ,AI模型展现技术自主新路径
2026-01-21 10:40
收藏
中国电信旗下人工智能研究机构TeleAI近日发布TeleChat3系列大型语言模型,这是中国首个完全基于国产半导体训练的大规模混合专家(MoE)模型。该模型训练全程采用华为昇腾910B AI芯片与开源MindSpore框架,验证了中国技术栈支持前沿规模模型开发的可行性。

TeleChat3产品线包含旗舰模型TeleChat3-105B-A4.7B-Thinking与密集架构的TeleChat3-36B-Thinking。前者采用细粒度MoE架构,总参数达1050亿,但单次推理仅激活47亿参数,在保证高性能的同时降低计算开销。训练在上海临港的计算基础设施完成,消耗15万亿代币数据,系统运行于华为昇腾Atlas800T A2训练服务器,与昇腾生态系统完全兼容。中国电信强调,华为硬件能满足大规模教育领域训练的严苛要求,但具体训练效率与性能对比数据尚未公开。
模型核心创新在于“思考模式”功能。通过对话模板中的引导符号,模型可生成中间推理步骤并展示思维过程,类似“思维导图”技术但被定位为架构级功能。中国电信称,该模式在知识问答、数学推理、代码生成等复杂任务中表现突出,六个核心维度性能接近国际先进水平。不过,由于缺乏与GPT-5或Claude的直接基准测试,第三方评估仍需时间验证。
作为中国“人工智能+”计划的一部分,TeleChat3提供了一种避免依赖外国技术的国产模式。与其他项目不同,中国电信已将模型权重、推理代码及使用示例开源至GitHub与ModelScope平台,为学术研究与商业开发提供便利。这一举措能否推动模型在国际市场获得关注,仍有待后续发展。
相关推荐

美国微软Azure Local扩展至数千节点,主权私有云大规模升级
2026-05-01

美国A3公布2026年恩格尔伯格机器人奖:日本JARA执行董事藤原浩获领导力奖,美国ATI联合创始人利特尔获应用奖
2026-05-01

意大利达拉拉与美国IBM合作开发GIST物理AI模型,CFD仿真时间从数小时压缩至10秒
2026-05-01

美国OpenAI推出高级账户安全模式,ChatGPT与Codex账户告别密码登录
2026-05-01

美国T-Mobile星链移动在加拿大和新西兰开通漫游
2026-05-01

美国EMAC宣布2026光明电子制造挑战赛,三轮赛制从PCB设计到机器人竞技
2026-05-01

美国OpenAI ChatGPT Images 2.0印度下载量占全球三分之一,整体日活增长仅1%
2026-05-01

加拿大联邦政府向萨斯喀彻温省科技领域投入790万加元,重点扶持AI商业化
2026-05-01

新加坡SpaceComputer计划10月进行在轨测试,验证太空安全计算基础设施
2026-05-01

美国HPE推出新一代ProLiant边缘服务器,NPU协同GPU强化分布式AI推理
2026-05-01
最新简讯
1
美国微软Azure Local扩展至数千节点,主权私有云大规模升级
2
美国A3公布2026年恩格尔伯格机器人奖:日本JARA执行董事藤原浩获领导力奖,美国ATI联合创始人利特尔获应用奖
3
意大利达拉拉与美国IBM合作开发GIST物理AI模型,CFD仿真时间从数小时压缩至10秒
4
美国OpenAI推出高级账户安全模式,ChatGPT与Codex账户告别密码登录
5
美国T-Mobile星链移动在加拿大和新西兰开通漫游
6
美国EMAC宣布2026光明电子制造挑战赛,三轮赛制从PCB设计到机器人竞技
7
美国OpenAI ChatGPT Images 2.0印度下载量占全球三分之一,整体日活增长仅1%
8
加拿大联邦政府向萨斯喀彻温省科技领域投入790万加元,重点扶持AI商业化
9
新加坡SpaceComputer计划10月进行在轨测试,验证太空安全计算基础设施
10
美国LightForce推出患者专用3D打印金属托槽
