维度网讯,中信证券研究部于2026年4月16日发布报告指出,Agent与多模态等AI应用爆发驱动Token调用量井喷,进而导致中国算力荒,中国大模型在推理端积极适配为中国算力厂商带来加速放量机遇。中信证券预计2026年中国算力芯片出货量至少实现翻倍以上增长,将为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲增长动能。
报告分析认为,OpenClaw热潮及多模态AI应用普及是算力需求边际加速的两项核心催化。以OpenClaw为代表的AI Agent单次任务消耗Token是ChatBot的10至100倍,而中国厂商积极布局纷纷推出OpenClaw类产品进一步加速其普及并拉升对应算力支持需求。文生图、文生视频等AI多模态应用持续爆火,图片输入与生成、视频识别与生成相比于纯文本对话,单次交互对应的Token消耗通常呈数量级上升。字节Seedance等中国多模态大模型快速崛起,中国多模态AI应用热潮加速爆火。全球最大的API聚合平台OpenRouter数据显示,2026年4月周度累计Token消耗量较一年前提升约7至8倍,其中中国大模型是爆发主驱力,最新市占率约40%。
Token调用量井喷带来算力需求极大爆发,供给侧受各类硬约束短期边际增量有限,目前中国已出现严重算力荒。腾讯云3月上调混元系列核心模型价格约430%以上,4月上调AI算力、容器服务及弹性MapReduce等产品刊例价约5%。中国大模型如Kimi在使用过程中时常出现“高峰期算力不足”提示。B端算力租赁市场AI芯片租赁价格走高,据SemiAnalysis数据,H100一年期租赁合约价格已由2025年10月低点约1.70美元/小时/GPU提升至2026年3月的2.35美元/小时/GPU,涨幅近40%。2月以来中国头部云厂商及模型厂商均明确公开提及算力资源紧缺。
中国算力在推理端迎来加速放量机遇。中信证券指出,AI芯片需求可分为训练和推理,目前Agent和多模态应用的爆发对推理端算力需求拉动极大。从中国算力导入难度角度看,推理环节对算力产品综合性能要求相较训练端任务更低,中国算力芯片厂商通过与互联网厂商深度合作,针对特定需求定制化优化,能够提供更适配互联网厂商需求的推理芯片,中国替代节奏相较于训练端进展更快。当前中国大模型在推理端已开始积极适配中国算力芯片,智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流中国芯片平台的深度推理适配与算子级优化,DeepSeek V4模型首次实现与华为昇腾等中国芯片深度适配。
政策层面持续加码中国算力产业链。深圳市工业和信息化局于2026年3月发布《深圳市加快推进人工智能服务器产业链高质量发展行动计划(2026—2028年)》,聚焦八大重点领域,支持中国GPU、NPU、CPU、DPU等核心芯片产品加快应用和迭代,加快存储芯片先进封装技术攻关,重点发展企业级SSD、企业级内存模组等高端存储产品,强化近存封装、存算一体等新型技术研发。赛迪顾问预计,到2026年中国算力总规模将突破1200EFLOPS,稳居全球第二,其中智能算力贡献率接近90%。
中商产业研究院数据显示,2026至2030年中国GPU市场将迈入高速放量期,市场规模预计从2050亿元攀升至5420亿元。预计2028年前后中国GPU在推理市场占有率将突破40%,训练市场突破25%。2027年后随着3nm制程中国GPU量产和Chiplet技术普及,单位算力成本将下降30%以上,推动GPU从高端科研设备向通用生产力工具转变。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









