DeepSeek正式推出新型数学推理模型DeepSeekMath-V2,该模型采用创新的自我验证训练框架,在多项高难度数学竞赛中展现出卓越性能。这一开源模型的发布为数学智能系统的发展提供了新的技术路径。
DeepSeekMath-V2基于DeepSeek-V3.2-Exp-Base架构构建,其核心创新在于引入了大型语言模型验证器。该验证器能够自动审查模型生成的数学证明过程,并通过持续学习高难度样本来优化整体性能。这种自验证训练机制显著提升了模型的数学推理可靠性。
在性能测试中,DeepSeekMath-V2在国际数学奥林匹克竞赛2025和中国数学奥林匹克2024中均达到金牌水平,在普特南数学竞赛2024中获得118分(满分120分)。
目前,DeepSeekMath-V2的完整代码与模型权重已在Hugging Face和GitHub平台开源。这种开放策略将有助于全球研究社区共同推进数学推理技术的前沿探索。模型的自我验证框架特别注重数学论证的严谨性,为复杂问题的求解提供了新的方法论。
DeepSeekMath-V2采用的自验证机制不仅提升了数学问题求解的准确率,更为构建可信赖的人工智能系统奠定了技术基础。开源社区的积极参与将加速这类自我改进型数学推理模型的进一步完善。









