英伟达宣布推出首款专为大规模上下文处理而设计的专用 GPU——Rubin CPX,适用于大规模编码和生成视频等高要求任务。
Rubin CPX 通过将理解 AI 提示与生成响应的任务分离,提升客户处理效率。该硬件预计作为 Vera Rubin 平台的一部分运行,该平台整合了 Vera CPU 和 Rubin GPU。全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。
Rubin CPX GPU 配备 128GB GDDR7 显存,具备 3 倍 attention capabilities,并使用 4-bit NVFP4 精度提供 30 petaflops 的计算能力。
英伟达 CEO 黄仁勋表示,Rubin CPX 是首款专为大规模上下文 AI 设计的 CUDA GPU,可同时处理跨越数百万个知识符号的模型。他指出 1 亿美元的投资可产生 50 亿美元的收益。
Rubin CPX 将获得包括 Nemotron 在内的完整软件栈支持,该系列模型涵盖从 Nano 到 Ultra 的多种规格,适用于不同规模的应用场景。
英伟达预计 Rubin CPX 将于 2026 年底推出。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。