DeepSeek R1低调完成小升级:思考时间更长 性能大幅提升

DeepSeek于5月28日宣布其R1模型完成小版本升级,但未公开详细信息。根据Hugging Face显示,此次开源版本为0528。

网友测评表明,DeepSeek-R1的性能显著提升,基于DeepSeek-V3-0324训练(参数660B)。在LiveCodeBench基准测试中,新版本性能接近o3-mini(High)和o4-mini(Medium),超越Gemini 2.5 Flash。

有科技媒体指出,新模型编码能力极强,但单任务处理时间延长至30-60分钟。此外,在模拟物理碰撞测试中,DeepSeek-R1表现优于Claude-4-Sonnet。

此前传言称,DeepSeek计划推出下一代大模型R2,可能采用混合专家模型(MoE)架构。然而,内部人士透露此传言真实性较低,R1升级或将取代R2发布。

业内人士提醒应理性看待此次升级成果,期待权威评测结果出炉。与此同时,英伟达发布的第一财季财报显示,期内营收440.62亿美元,同比增长69%。英伟达CEO黄仁勋提到市场对推理模型的关注,强调算力需求增长趋势。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1