英伟达今日宣布推出NVIDIA TensorRT for RTX,该框架将支持Windows 11系统,为GeForce RTX全系显卡提供AI推理加速,性能可达DirectML方案的两倍。据悉,该技术将于6月通过开发者官网正式推送。
技术细节显示,TensorRT原生兼容Windows ML框架,其中ComfyUI应用的性能提升尤为显著,较DirectML实现翻倍,其他应用也能获得1.5至1.7倍的性能优化。此外,TensorRT支持即时GPU专属优化,推理库文件体积大幅缩减至原有的1/8。
英伟达表示,全新Windows ML推理框架通过ONNX Runtime构建,可自动调用TensorRT for RTX,为PC端AI工作负载提供超50%的性能提升。目前,英伟达已支持超150个AI SDK,并计划本月推出5个新的ISV集成,涵盖LM Studio、Topaz Video AI、哔哩哔哩等应用。