DeepSeek发布数学专用模型DeepSeekMath-V2

DeepSeek昨日上线全新数学专用模型DeepSeekMath-V2,该模型基于DeepSeek-V3.2-Exp-Base构建,参数规模达685B。

其核心特性在于具备自我验证能力,能够自主检查解题步骤、识别逻辑漏洞并进行修正,实现自我反思与辩论,确保推理过程无瑕。

在能力表现上,该模型达到国际数学奥林匹克竞赛金牌水平,并在IMO 2025模拟赛中解决5/6道题,在Putnam 2024竞赛中取得118/120分的接近满分成绩。

模型采用生成器与验证器双系统架构:生成器负责产出解题过程,验证器则逐行审查逻辑严谨性、公式准确性及推导完整性,通过反馈机制驱动生成器持续优化。

为进一步提升验证精度,系统引入元验证机制,对验证器本身的评判进行监督与校正,形成闭环训练体系,增强整体推理可靠性。

该模型延续DeepSeek开源传统,同步公开论文《DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning》。

此技术路径回应了前OpenAI首席科学家Ilya Sutskever关于当前AI模型评测表现与实际应用存在鸿沟的担忧,转向以内在逻辑自洽为目标的训练范式。

相较于以往仅奖励最终答案正确性的强化学习方法,DeepSeekMath-V2将推理过程本身作为优化目标,显著提升复杂证明任务的表现。

其在Putnam竞赛中的表现尤为突出,该赛事为全球最难大学生数学竞赛之一,历年中位数得分常为0或1分,人类最高分去年为90分。

模型通过多轮迭代训练,实现了从应试型推理向具备批判性思维和泛化理解力的方向演进,展现出更强的通用数学问题解决潜力。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1