幻方量化旗下的AI公司深度求索(DeepSeek)今日正式发布其最新模型DeepSeek-R1,并同步开源模型权重。官方表示,DeepSeek-R1在后训练阶段大规模应用了强化学习技术,极大提升了模型的推理能力。尤其在数学、代码和自然语言推理等任务上,性能已比肩OpenAI o1正式版。
值得一提的是,DeepSeek-R1蒸馏出的小模型超越了OpenAI o1-mini。此次发布的DeepSeek-R1-Zero和DeepSeek-R1两个660B模型,以及通过DeepSeek-R1输出蒸馏出的6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。
DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。此外,DeepSeek将模型开源License统一使用MIT,支持用户进行“模型蒸馏”,进一步促进技术的开源和共享。用户可通过官网或App调用DeepSeek-R1完成各类推理任务。
免责声明:本文内容由开放的智能模型自动生成,仅供参考,不构成任何专业建议或决策依据。用户应自行核实信息的准确性和可靠性,本站对用户因使用或依赖本文内容而产生的任何风险或损失不承担任何责任。如有疑问或发现内容有误,请联系本站进行处理。