华为昇腾384超节点亮相WAIC

在7月26日-7月29日于上海世博展览馆H1-A301举办的WAIC(世界人工智能大会)上,华为昇腾384超节点,即Atlas 900 A3 SuperPoD首次展出,成为备受瞩目的镇馆之宝,是业界目前最大规模的超节点。

昇腾384超节点打破了以CPU为中心的冯诺依曼架构,创新提出了对等计算架构,并将总线从服务器内部扩展到整机柜、甚至跨机柜,改变了数据传输和处理的方式。传统由服务器、存储、网络等设备堆叠而成的集群,在大规模训练时存在资源利用率低、故障频发的问题,阻碍AI发展。

昇腾超节点通过高速总线连接多颗NPU,突破了互联瓶颈,使超节点像一台计算机一样协同工作。跨节点通信带宽提升15倍,数据传输速度加快;通信时延从2μs降至0.2μs,下降了10倍;最大可实现384颗NPU点到点超大带宽互联,是业界唯一支持DeepSeek V/R1在一个超节点域内即可完成所有专家并行(EP)方案的产品,也是MoE模型的最佳训练/推理方案。

昇腾384超节点拥有三大优势:超大带宽方面,超节点内任意两个AI处理器之间通信带宽相较传统架构提升15倍,单跳通信时延降低10倍,数据交互更流畅。超低时延方面,支持全局内存统一编址,具备高效的内存语义通信能力,通过更低时延指令级内存语义通信,满足大模型训练/推理中的小包通信需求,提升专家网络小包数据传输及离散随机访存通信效率,是业界唯一突破Decode时延15ms的方案,满足实时深度思考下的用户体验需求。超强性能方面,实际测试显示在昇腾超节点集群上,LlaMA3等千亿稠密模型训练性能可达传统集群的2.5倍以上;在通信占比更高的Qwen、DeepSeek等多模态、MoE模型上,性能提升更是可以达到3倍以上。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1