维度网讯,DeepSeek于4月26日发布API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一,V4-Pro叠加限时2.5折后,百万Tokens输入缓存命中低至0.025元,创全球大模型价格新低。
根据DeepSeek官方API定价页面公示,本次降价覆盖V4系列全模型,核心调整集中在输入缓存命中场景。DeepSeek-V4-Flash输入缓存命中价格从0.2元/百万Tokens降至0.02元/百万Tokens。面向企业级用户的DeepSeek-V4-Pro优惠力度更大,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前叠加2.5折限时特惠,实际仅0.025元/百万Tokens。缓存未命中输入从12元降至3元,输出从24元降至6元。
此次大幅降价的底层支撑来自DeepSeek-V4的技术升级。DeepSeek-V4预览版于4月24日正式发布并开源,包含V4-Pro与V4-Flash两款模型,均支持100万Token超长上下文。自研稀疏注意力架构使推理算力消耗大幅降低,Pro版单Token算力仅为V3.2的27%,KV缓存降至10%,从底层实现成本优化。官方参数显示,DeepSeek-V4-Pro激活参数49B、预训练数据33T,定位高性能旗舰;DeepSeek-V4-Flash激活参数13B、预训练数据32T,主打高速与低成本。
在Agent能力评测中,DeepSeek-V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。DeepSeek内部已将V4作为员工使用的Agentic Coding模型,评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式。世界知识测评中,V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini 3.1 Pro。数学、STEM及竞赛型代码测评中,V4-Pro超越当前所有已公开评测的开源模型,比肩世界顶级闭源模型。V4-Flash在世界知识储备方面稍逊于Pro版本,但展现出接近的推理能力,由于模型参数和激活更小,能够提供更快捷、经济的API服务。
算力生态层面,DeepSeek-V4与华为昇腾的深度协同是降价的另一关键因素。昇腾超节点全系列产品已支持DeepSeek-V4系列模型。DeepSeek在技术报告中披露,英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度专家并行方案,与强力非融合基线相比,该方案在通用推理任务中实现1.50至1.73倍加速,在延迟敏感场景中最高可达1.96倍加速。DeepSeek强调,随着2026年下半年昇腾超节点全系列产品批量上市,Pro版价格有望进一步下调。高频调用与长文本处理场景成本降幅超过90%,RAG知识库、智能客服、文档分析等缓存命中率较高的应用可直接实现商用成本大幅下降。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com










