DeepSeek API输入缓存价格降至首发十分之一，V4-Pro限时0.025元/百万Tokens

2026-04-27 09:39

关键词:

维度网讯，DeepSeek于4月26日发布API价格调整公告，全系API输入缓存命中价格降至首发价的十分之一，V4-Pro叠加限时2.5折后，百万Tokens输入缓存命中低至0.025元，创全球大模型价格新低。

根据DeepSeek官方API定价页面公示，本次降价覆盖V4系列全模型，核心调整集中在输入缓存命中场景。DeepSeek-V4-Flash输入缓存命中价格从0.2元/百万Tokens降至0.02元/百万Tokens。面向企业级用户的DeepSeek-V4-Pro优惠力度更大，原价1元/百万Tokens的缓存输入降至0.1元，2026年5月5日前叠加2.5折限时特惠，实际仅0.025元/百万Tokens。缓存未命中输入从12元降至3元，输出从24元降至6元。

此次大幅降价的底层支撑来自DeepSeek-V4的技术升级。DeepSeek-V4预览版于4月24日正式发布并开源，包含V4-Pro与V4-Flash两款模型，均支持100万Token超长上下文。自研稀疏注意力架构使推理算力消耗大幅降低，Pro版单Token算力仅为V3.2的27%，KV缓存降至10%，从底层实现成本优化。官方参数显示，DeepSeek-V4-Pro激活参数49B、预训练数据33T，定位高性能旗舰;DeepSeek-V4-Flash激活参数13B、预训练数据32T，主打高速与低成本。

在Agent能力评测中，DeepSeek-V4-Pro已达到当前开源模型最佳水平，并在其他Agent相关评测中同样表现优异。DeepSeek内部已将V4作为员工使用的Agentic Coding模型，评测反馈使用体验优于Sonnet 4.5，交付质量接近Claude Opus 4.6非思考模式。世界知识测评中，V4-Pro大幅领先其他开源模型，稍逊于顶尖闭源模型Gemini 3.1 Pro。数学、STEM及竞赛型代码测评中，V4-Pro超越当前所有已公开评测的开源模型，比肩世界顶级闭源模型。V4-Flash在世界知识储备方面稍逊于Pro版本，但展现出接近的推理能力，由于模型参数和激活更小，能够提供更快捷、经济的API服务。

算力生态层面，DeepSeek-V4与华为昇腾的深度协同是降价的另一关键因素。昇腾超节点全系列产品已支持DeepSeek-V4系列模型。DeepSeek在技术报告中披露，英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度专家并行方案，与强力非融合基线相比，该方案在通用推理任务中实现1.50至1.73倍加速，在延迟敏感场景中最高可达1.96倍加速。DeepSeek强调，随着2026年下半年昇腾超节点全系列产品批量上市，Pro版价格有望进一步下调。高频调用与长文本处理场景成本降幅超过90%，RAG知识库、智能客服、文档分析等缓存命中率较高的应用可直接实现商用成本大幅下降。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国