阿里云推出自动驾驶领域模型训练与推理加速框架PAI-TurboX,该框架能够显著提升感知、规划控制及世界模型的训推效率,在多个任务中将训练时间缩短约50%。
当前,自动驾驶方案需融合图像、激光雷达、毫米波雷达和GPS等多模态数据,但大规模训练样本的数据加载与预处理效率较低,导致GPU资源浪费。此外,由于自动驾驶模型算子数量庞大,现有训推框架执行效率低下且优化难度高。
PAI-TurboX针对上述问题提供全面解决方案。在系统层面,通过优化CPU亲和性、动态编译和流水线并行策略,大幅提高模型训练和推理效率;在数据层面,采用高性能DataLoader引擎,优化数据预处理流程并实现智能训练样本分组,从而提升数据处理效率。
此外,PAI-TurboX还具备算子优化与量化能力,可降低训练阶段访存延迟,提升吞吐效率。在推理任务中,其能在保证精度的同时减少计算开销与内存带宽需求,支持异构平台高性能推理部署。
实测表明,在3D物体检测模型BEVFusion训练中,PAI-TurboX将时间缩短58.5%;矢量化高精地图构建模型MapTR训练中,时间减少53%;端到端自动驾驶模型SparseDrive训练中,感知模块与联合训练阶段分别提速51.5%和48.5%。
阿里云人工智能平台PAI提供全流程AI开发与运维服务,自2016年问世以来已服务超10万家企业客户及数百万开发者,支撑多项MaaS服务及社区发展。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。