英特尔Gaudi 2E为DeepSeek V3.1提供加速支持

英特尔官方宣布,Gaudi 2E AI加速器现已为DeepSeek-V3.1提供深度优化支持。

英特尔 Gaudi 2E 采用 7nm 制程,配备 96GB HBM2E 内存、48MB SRAM,具备 2.4TB 总内存带宽,针对随机访问、线性访问场景进行深度优化,有效避免了 AI 训练或推理任务的延迟。

该加速器具备 24 个完全可编程的张量处理器核心(TPC)、2 个矩阵乘法引擎(MME),提供 24 个 100 GbE 端口,支持多卡互联,为用户提供了灵活的、可定制化的解决方案。

实测数据显示,在部署了 8 张 Gaudi 2E 的一体机服务器上运行 DeepSeek-V3.1 模型时,性能表现优异:在输入 / 输出 token 长度均为 1k、多用户并发数为 30 的条件下,每个并发 token 生成速率达到每秒 10 token;在输入 / 输出 token 长度均为 2k、多用户并发数为 28 的条件下,生成速率同样达到每秒 10 token。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1