AMD发布ROCm 7开源软件栈,AI推理性能提升达3.8倍

在今日凌晨的AMD Advancing AI 2025活动中,AMD正式推出下一代开源软件栈技术ROCm 7,旨在加速AI开发与生产力。此次升级从ROCm 6迈入新一代,重点优化了推理能力,并为AI工作负载带来最高3.5倍的性能提升。

ROCm 7新增多项关键功能,包括最新算法与模型、扩展AI的高级功能、对MI350系列的支持以及企业级集群管理。此外,该版本还强化了框架支持,如vLLM v1和SGLang,并引入GEMM自动调优、MoE等新内核技术。

在数据类型支持上,ROCm 7全面兼容FP8、FP6、FP4及混合精度,尤其针对MI350系列优化了FP6和FP4计算。实测显示,其Llama 3.1 70B性能提升3.2倍,Qwen2-72B提升3.4倍,DeepSeek R1更是达到3.8倍。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1