2025年12月4日,英伟达发布CUDA 13.1,推出全新CUDA Tile编程范式。此次更新旨在简化AI与加速计算开发,通过基于数据块(Tile)的并行编程模型,屏蔽张量核心等硬件细节,提升代码在多代GPU上的可移植性。CUDA Tile IR作为中间表示层,支持更高层次的算法设计,与传统SIMT模型共存。开发者可通过cuTile Python等工具使用新功能。该更新降低高性能计算开发门槛,适配未来GPU架构演进。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
2025年12月4日,英伟达发布CUDA 13.1,推出全新CUDA Tile编程范式。此次更新旨在简化AI与加速计算开发,通过基于数据块(Tile)的并行编程模型,屏蔽张量核心等硬件细节,提升代码在多代GPU上的可移植性。CUDA Tile IR作为中间表示层,支持更高层次的算法设计,与传统SIMT模型共存。开发者可通过cuTile Python等工具使用新功能。该更新降低高性能计算开发门槛,适配未来GPU架构演进。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。