6月21日,华为开发者大会2025期间,在网络CXO圆桌会议上,华为云携手行业领袖客户与顶尖高校,共同探讨了AI时代云网络的未来。在AI驱动的下一代云网络建设中,华为云MatrixLink和ANC成为了会议的核心焦点,围绕这两大关键产品展开的六大问题讨论,为企业与科研机构提供了清晰的技术蓝图与落地路径。
会上,华为云网络服务项目群总监青岚发表“AI时代网络跨入新纪元:基础网络提供极致性能,应用网络极简易用”主题演讲,他重点提到,MatrixLink充分发挥超节点优势,支撑大规模训练和推理性能提升;而ANC简化网络连接,构建新一代网络互连模式。
华为云网络服务项目群总监青岚
随后,华为云高性能网络架构师Kevin以“MatrixLink:服务于AI时代高性能的通信网络”为主题,分享了MatrixLink相关的孵化背景、产品能力及技术优势。
在AI算力需求爆发的背景下,传统网络架构已无法满足大规模AI训练和推理的需求。作为华为云的核心创新成果之一,MatrixLink通过重新定义AI网络通信,正在为AI产业的持续升级提供强力支撑。
华为云高性能网络架构师Kevin
迷你玩在“迷你玩:AI驱动下的游戏应用”演讲中,介绍了迷你玩在沙盒游戏到AI驱动的互动娱乐生态和基于MatrixLink智算网络实现游戏场景网络加速。
深圳市迷你玩技术有限公司运维总监谢泽生
在圆桌的第一个讨论环节,重点讨论三个MatrixLink相关的问题
挑战一:网络复杂度如何应对?
超节点网络的引入提升了AI系统性能,但也显著增加了运维复杂度。对此,MatrixLink提供了三大解决方案:
硬件可靠性保障:通过光模块的全生命周期管理与故障预测技术,确保硬件高效运行。
系统化运维管理:全面覆盖运维信息,并与租户生产系统对接,快速发现与解决故障,减少亚健康状态的影响。
智能通信调度:为客户提供API支持,帮助客户实现自动化的部署、网络调度、故障恢复,提高效率和降低运维成本。
挑战二:如何优化AI任务调度?
MatrixLink改变了传统“一机八卡”AI系统的底层逻辑,通过 Hyper Instance逻辑超节点,实现资源按需分配。例如,用户可申请一个64张卡组成的逻辑超节点,云平台则负责资源调度与生命周期管理,屏蔽底层复杂性。
此外,MatrixLink开放了智能化任务调度API,支持客户在任务下发阶段传递模型信息、切分策略与资源配置,由平台提供并行切分、部署和通信优化建议,帮助用户实现性能最大化。
挑战三:如何构建开放生态?
华为的超节点网络基于自主创新协议,但高度兼容现有生态,降低了客户迁移成本。
协议兼容性:支持VPC网络的RDMA、ScaleOut网络的RoCE,以及ScaleUp网络的HCCS,实现灵活的网络编程。
开源与定制服务:通过集合通信库合通信中间件,与开源生态对接,客户无需感知底层网络语义即可完成高性能任务部署,同时提供定制化优化服务,满足客户的个性化需求。
圆桌的第二个议题主要是讨论ANC相关的内容,作为华为云的另一核心产品,ANC(云原生应用网络)以简化网络配置、提升资源利用率为目标,为企业和科研机构提供了高效便捷的上云体验。
华为云AI应用网络技术专家阿呆在“ANC:华为云原生应用网络降低网络复杂度的利器”主题演讲中,分享了ANC相关的孵化背景、产品能力及技术优势。
华为云AI应用网络技术专家阿呆
随后,中国科学技术大学许杨副教授提出为实现对不同地域数据中心算力的联合利用,并提高模型训练系统的可靠性和容灾能力,设计提出基于传输并行与陈旧补偿的大模型跨域训练方案,在保障模型测试精度的同时,可显著提升算网资源利用率。
中国科学技术大学副教授许杨
在圆桌的第二个讨论环节,重点讨论了企业上云的核心诉求是什么?ANC如何解决?
在场嘉宾认为,企业在上云过程中,面临复杂的网络配置与资源调度问题。ANC通过以下措施,解决了这些痛点:
网络配置简化:无需复杂的跨地域网络规划,跨地域应用一键互连,同时提供跨区域的安全访问控制能力。
资源高效调度:部署应用时可以随便挑选跨地域的算力资源,并支持算力与网络的一秒弹性扩展。
业务跨域流动:ANC支持热/冷应用按需部署。例如,实时交易类“热应用”可部署在用户集中区域,而数据备份类“冷应用”则放置于算力与电力成本更低的地区,降低企业运营成本。更重要的是,ANC的跨域迁移功能可以一键完成业务“搬家”,确保服务不中断。ANC与MatrixLink的协同,不仅改变了AI网络的运维方式,还为AI Native网络的构建提供了技术支持。AI Native网络:未来的智能通信基础设施。AI Native网络将AI从传统集中式架构扩展到分布式智能网络,具备以下特征:
跨地域算力互连:推理服务依托ANC构建跨地域多VPC的极简组网,为跨区域异构算力集群提供网络支撑。
跨地域AI训推:支持大规模AI模型在跨地域资源上的高效运行,实现模型与样本数据跨地域的大带宽确定性传输。
开放生态支持:接入ANC后,应用将自动融入MCP和A2A生态,支持AI应用的工具化调用,AI应用可动态决定依赖关系,像搭积木一样自由组合。
本次网络圆桌会议通过对MatrixLink和ANC的深度探讨,为AI驱动的下一代云网络绘制了清晰的蓝图。从服务AI大规模训练的高性能网络,到简化企业上云路径的云原生应用网络,华为云以技术创新和生态开放为核心,为AI产业迈向智能时代提供了坚实的基础设施支持。
“AI驱动未来,网络承载无限可能。”未来,华为云将继续以技术为基础,为企业与行业创造更多价值。
声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。