英伟达GB200服务器实现MoE模型性能10倍提升- DoNews

DoNews > 公司新闻 > 英伟达GB200服务器实现MoE模型性能10倍提升

英伟达GB200服务器实现MoE模型性能10倍提升

推荐 2025-12-04 11:41:03

英伟达GB200 NVL72 AI服务器在混合专家模型上取得重大性能突破，相比上一代Hopper HGX 200性能提升10倍。测试基于开源大语言模型Kimi K2 Thinking、Deepseek-R1-0528和Mistral Large 3完成。

混合专家模型（MoE）是一种高效的AI大模型架构，通过仅激活与任务最相关的参数子集（专家）来处理问题，显著降低计算成本并提高处理速度。该架构类似人脑使用特定区域执行不同任务，利用路由器选择最相关专家生成每个token。自2025年初以来，几乎所有前沿AI模型均采用MoE设计。

为解决MoE模型扩展中的性能瓶颈，英伟达采用“协同设计”策略，整合GB200的72芯片配置、最高30TB快速共享内存、第二代Transformer引擎以及第五代NVLink高速互联技术。这些技术协同工作，高效拆分并分配Token批次至各GPU，并以非线性速率提升通信量，将专家并行计算提升至新水平，实现性能飞跃。

除硬件协同设计外，英伟达实施多项全栈优化措施提升MoE推理性能。NVIDIA Dynamo框架将预填充（prefill）和解码（decode）任务分配给不同GPU，实现任务解耦服务，使解码阶段可大规模并行运行。系统同时采用NVFP4格式，在保持计算精度的同时进一步提升性能与效率，确保AI计算流程高效稳定。

此次GB200 NVL72取得的性能突破对英伟达及其合作伙伴具有重要意义，成功克服MoE模型扩展时的计算瓶颈，满足日益增长的AI算力需求，巩固英伟达在AI服务器市场的领先地位。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

美国“阿耳忒弥斯 2 号”载人绕月任务成功升空美国于4月1日发射‘阿耳忒弥斯2号’载人绕月任务，SLS火箭搭载4名宇航员执行10天环月飞行，创深空距离新纪录并首次亲见月球背面。

长安汽车 3 月销量 27.06 万辆，环比增长 78% 长安汽车3月销量27.06万辆，环比增78%；新能源销8.96万辆，增112%；海外销10.39万辆，增60%。

欧菲光2025年报：归母净利润4163万元，下降28.7% 欧菲光2025年营收221.5亿元（+8.4%），净利4163万元（-28.7%），Q4扭亏为盈；智能汽车、智能手机光学产品技术领先，新兴领域拓展顺利。

奇瑞集团3月销量24.1万辆，单月出口再创中国汽车新纪录奇瑞3月销量24.1万辆，同比增12.1%；一季度销60.2万辆，出口39.3万辆、新能源16.1万辆；高端化、出海、技术全链加速突破。

网易云音乐客服回应无故封号：已恢复网易云音乐今日出现大规模账号误封，提示“涉嫌违规封禁7天”；官方回应称问题已修复，用户可重新登录。

女员工举报高管性骚扰，奇瑞商用车紧急回应奇瑞商用车员工实名举报总经理职场骚扰，公司迅速调查并免职解聘，强调零容忍及完善管理机制。

吉利汽车 3 月销量 233031 辆，与去年同期持平吉利汽车3月销量23.3万辆同比持平，极氪增长90%，插混增70%，出口增120%，纯电下滑18%。

多家国内航司宣布：上调国内燃油附加费自2026年4月5日起，国内航线燃油附加费调整为：800公里及以下60元/人，以上120元/人；儿童等特殊旅客减半，婴儿免收。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号