DeepSeek于5月28日宣布其R1模型完成小版本升级,但未公开详细信息。根据Hugging Face显示,此次开源版本为0528。
网友测评表明,DeepSeek-R1的性能显著提升,基于DeepSeek-V3-0324训练(参数660B)。在LiveCodeBench基准测试中,新版本性能接近o3-mini(High)和o4-mini(Medium),超越Gemini 2.5 Flash。
有科技媒体指出,新模型编码能力极强,但单任务处理时间延长至30-60分钟。此外,在模拟物理碰撞测试中,DeepSeek-R1表现优于Claude-4-Sonnet。
此前传言称,DeepSeek计划推出下一代大模型R2,可能采用混合专家模型(MoE)架构。然而,内部人士透露此传言真实性较低,R1升级或将取代R2发布。
业内人士提醒应理性看待此次升级成果,期待权威评测结果出炉。与此同时,英伟达发布的第一财季财报显示,期内营收440.62亿美元,同比增长69%。英伟达CEO黄仁勋提到市场对推理模型的关注,强调算力需求增长趋势。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。