DeepSeek R1 模型昨日完成小版本升级,最新版本为 DeepSeek-R1-0528。用户可通过官方网站、App 或小程序开启“深度思考”功能体验新版本,API 也已同步更新。此次升级重点强化了模型的思维深度与推理能力,基于 2024 年发布的 DeepSeek V3 Base 模型,后训练中投入更多算力,使其在数学、编程及通用逻辑测评中表现优异,接近国际顶尖水平。
新版模型在复杂推理任务中的准确率显著提高,例如 AIME 2025 测试中由 70% 提升至 87.5%。此外,幻觉问题优化明显,幻觉率降低 45%-50%,创意写作能力进一步增强,支持更长篇幅和贴近人类风格的作品生成。同时,工具调用功能得到扩展,前端代码生成、角色扮演等领域也有提升。
API 更新支持 Function Calling 和 JsonOutput,并调整 max_tokens 参数限制输出长度。DeepSeek-R1-0528 开源权重已在 ModelScope 和 Huggingface 平台发布,采用 MIT License,允许用户自由使用和蒸馏。