CoreWeave 最新测试显示,使用 DeepSeek R1 推理模型时,4 块英伟达 Blackwell 架构 GB300 芯片可完成原本需 16 块 H100 GPU 才能运行的任务,单卡吞吐量提升达 6 倍。
测试归因于 GB300 的架构升级,包括增强内存与带宽,其 NVL72 平台支持高达 37TB 内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台采用 4 路并行设计,结合 NVLink 和 NVSwitch 高速互连技术,有效减少 GPU 间数据分割次数,提高通信效率。
CoreWeave 指出,此次提升不仅是 FLOPs 算力的增强,更体现系统架构在实际业务场景中的效率优化。对于运行复杂 AI 模型的企业客户,GB300 NVL72 提供更高扩展性与更低延迟,有助于更快速且经济地部署 AI 服务。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。