中信证券：Token井喷致算力荒，2026年国产算力芯片出货量预计翻倍

2026-04-16 09:07

关键词:

维度网讯，中信证券研究部于2026年4月16日发布报告指出，Agent与多模态等AI应用爆发驱动Token调用量井喷，进而导致中国算力荒，中国大模型在推理端积极适配为中国算力厂商带来加速放量机遇。中信证券预计2026年中国算力芯片出货量至少实现翻倍以上增长，将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。

报告分析认为，OpenClaw热潮及多模态AI应用普及是算力需求边际加速的两项核心催化。以OpenClaw为代表的AI Agent单次任务消耗Token是ChatBot的10至100倍，而中国厂商积极布局纷纷推出OpenClaw类产品进一步加速其普及并拉升对应算力支持需求。文生图、文生视频等AI多模态应用持续爆火，图片输入与生成、视频识别与生成相比于纯文本对话，单次交互对应的Token消耗通常呈数量级上升。字节Seedance等中国多模态大模型快速崛起，中国多模态AI应用热潮加速爆火。全球最大的API聚合平台OpenRouter数据显示，2026年4月周度累计Token消耗量较一年前提升约7至8倍，其中中国大模型是爆发主驱力，最新市占率约40%。

Token调用量井喷带来算力需求极大爆发，供给侧受各类硬约束短期边际增量有限，目前中国已出现严重算力荒。腾讯云3月上调混元系列核心模型价格约430%以上，4月上调AI算力、容器服务及弹性MapReduce等产品刊例价约5%。中国大模型如Kimi在使用过程中时常出现“高峰期算力不足”提示。B端算力租赁市场AI芯片租赁价格走高，据SemiAnalysis数据，H100一年期租赁合约价格已由2025年10月低点约1.70美元/小时/GPU提升至2026年3月的2.35美元/小时/GPU，涨幅近40%。2月以来中国头部云厂商及模型厂商均明确公开提及算力资源紧缺。

中国算力在推理端迎来加速放量机遇。中信证券指出，AI芯片需求可分为训练和推理，目前Agent和多模态应用的爆发对推理端算力需求拉动极大。从中国算力导入难度角度看，推理环节对算力产品综合性能要求相较训练端任务更低，中国算力芯片厂商通过与互联网厂商深度合作，针对特定需求定制化优化，能够提供更适配互联网厂商需求的推理芯片，中国替代节奏相较于训练端进展更快。当前中国大模型在推理端已开始积极适配中国算力芯片，智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流中国芯片平台的深度推理适配与算子级优化，DeepSeek V4模型首次实现与华为昇腾等中国芯片深度适配。

政策层面持续加码中国算力产业链。深圳市工业和信息化局于2026年3月发布《深圳市加快推进人工智能服务器产业链高质量发展行动计划(2026—2028年)》，聚焦八大重点领域，支持中国GPU、NPU、CPU、DPU等核心芯片产品加快应用和迭代，加快存储芯片先进封装技术攻关，重点发展企业级SSD、企业级内存模组等高端存储产品，强化近存封装、存算一体等新型技术研发。赛迪顾问预计，到2026年中国算力总规模将突破1200EFLOPS，稳居全球第二，其中智能算力贡献率接近90%。

中商产业研究院数据显示，2026至2030年中国GPU市场将迈入高速放量期，市场规模预计从2050亿元攀升至5420亿元。预计2028年前后中国GPU在推理市场占有率将突破40%，训练市场突破25%。2027年后随着3nm制程中国GPU量产和Chiplet技术普及，单位算力成本将下降30%以上，推动GPU从高端科研设备向通用生产力工具转变。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国