2025年中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,于7月19日正式发布全球最长距离大模型异构混训试验成果。
当前算力资源呈现异构化和多中心化格局,跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等问题成为行业挑战。针对超大模型跨域训练和碎片化算力整合需求,中国联通依托“算力智联网AINet”长距无损传输技术优势,结合上海人工智能实验室“DeepLink”超大规模跨域混训技术方案,在上海临港和山东济南鲍山数据中心间构建长度超1500公里的跨域异构混训系统。
联合团队通过自动调整多种并行策略和跨域收敛比下MoE模型和Dense模型的参数配置,完成超1500公里跨域的千亿参数AI大模型异构混训试验。经验证,等效算力可达单芯片单集群等效算力的95%以上。
在算力互联层面,采用联通自研内置长距RDMA协议栈的RoCE交换机,兼顾DC内和DC间高性能网络需求;在算力调度与资源管理层面,通过联通“智驭”平台实现对跨域网络和集群的统一管控及任务调度;在算力协同层面,基于DeepLink在训练加速、异构通信、并行策略等核心技术,实现千亿参数大模型在超长距离异构GPU环境下的高效训练。
中国联通表示,该成果标志着其在算力基础设施跨域协同调度、异构资源融合与高性能分布式训练等关键领域实现技术突破,为下一代互联网产业发展奠定基础。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。