DeepSeek发布V3模型降本技术报告- DoNews

DoNews > 公司新闻 > DeepSeek发布V3模型降本技术报告

DeepSeek发布V3模型降本技术报告

推荐 2025-05-16 10:18:02

DeepSeek日前公布了旗下V3模型在训练与推理过程中的降本技术细节，创始人梁文锋参与了报告撰写。

报告显示，DeepSeek-V3使用2048个英伟达H800GPU完成训练，实现了与超大规模集群相当的效果。其核心技术包括以下四个方面：

首先，采用多头潜在注意力（MLA）技术优化内存占用，将KV缓存大小降低至每token仅70KB，为传统方法的1/7至1/4，显著减轻显存压力。

其次，利用DeepSeek-MoE（混合专家架构）进行计算优化，通过只激活部分参数的方式，使训练成本降至同规模稠密模型的1/10，并能在消费级GPU上运行，达到每秒生成近20个token的速度。

第三，通过FP8低精度训练技术，将模型所需内存和计算量减半，同时借助精细量化保持精度。这使得训练成本降低50%，精度损失小于0.25%。

最后，在通信方面，DeepSeek-V3采用了多层胖树网络（Multi-Plane Fat-Tree），避免任务流量冲突；推理时，还结合流水线并行（DualPipe）技术，分阶段执行注意力计算与专家间通信，提升数据传输效率。

此外，DeepSeek-V3引入多token预测（MTP）方法进一步加速推理性能。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

《以法之名》，以声破局｜董晴的「张文菁时刻」十年沉淀，演员董晴的坡垒时刻。

投诉不断、课程质量存疑，十方融海被“抛弃”？其面临严峻挑战。

荣耀 Earbuds开放式耳机图赏：国补到手价594.15元荣耀发布Earbuds开放式耳机，重7.9g，支持双低音算法与降噪，售价594元起，续航达22小时，功能丰富。

荣耀手表 5 Ultra图赏：15天续航，国补到手1699.2元荣耀手表 5 Ultra采用一块1.5英寸466×466圆形OLED屏幕（支持AOD），提供指挥官、纵横家、极速者三种风格款式

黄仁勋链博会致辞：中国开源AI是推动全球进步的催化剂黄仁勋表示AI正重塑供应链及生产方式，中国开源AI推动全球进步，未来十年AI与机器人将驱动工厂智能化。

马斯克旗下企业推出AI女友，月费30美元 Grok推出AI伴侣功能，提供个性角色互动体验。

抖音加码酒旅投入亿级补贴推订房优惠抖音生活服务投入亿级补贴，推出酒店日历房团购、直播特惠券等活动，联合多家酒店集团提供6折起优惠及会员权益叠加。

传深圳众擎机器人停产？官方回应众擎机器人回应生产停滞传闻，称正加速产能爬坡，招聘全面展开，并将定期公开进展。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号