在6月4日举行的中国光网络研讨会上,中国工程院院士邬贺铨发表《智能体时代的光网络》主题演讲,系统阐述大模型智能体规模化应用对数字基础设施提出的新挑战,并聚焦入算网络、算内互联与算间互联三大层级的技术演进路径。
邬贺铨指出,随着大模型智能体(Agent)从概念走向规模化部署,Token调用量显著攀升,算力需求持续走高。预测显示,2030年全球IP流量年均增长60%~90%,其中AI流量占比将超60%;该类流量对丢包率与时延高度敏感,传统IP网络难以满足要求。
针对算力类型差异,他强调超算不宜做智算、智算不宜做通算;通算无法胜任智算、智算精度不足亦难承担超算任务。当前互联技术按层级分层选型:卡间互联优选CPO、LPO、OCS;机间互联采用Spine-Leaf架构,适配800G/1.6T可插拔光模块(OSFP)、硅光集成及DWDM+OTN;算间互联则依托DWDM+OTN、相干硅光高速光模块、广域RoCEv2+全域无损调度、光电路交换OCS、算力路由协议与SRv6算力切片等技术。
入算网络作为用户侧数据进入智算中心的通道,面临7×24小时运行与B端企业日均百万至亿级Token消耗带来的上行带宽瓶颈,且不同场景对时延与数据隐私要求差异显著。中小企业及高端个人用户本地接入以对称50G PON为主流方案;针对实时性要求高的业务,2000km往返基础物理时延约20ms,叠加处理后普遍超25ms,难以满足<20ms需求。应对措施包括:区分业务类型,允许30~100ms延迟业务远程处理;架构优化,在东部完成意图识别与轻量化预处理,仅向西部传输核心算力诉求并缓存常驻模型;技术升级,关键业务采用空芯光纤降低时延约30%,FC-NVMe实现设备+协议延迟低于1毫秒,短距低成本场景选用RoCEv2。
算内互联正向全光扁平架构演进,叶脊结构支撑千卡以上GPU集群,系统速率将从400G迈向2026年的1.6T、2028年的3.2T。光模块由可插拔800G逐步过渡至2026年近封装(NPO)与共封装(CPO),后者功耗降50%、密度升10倍;2028年后有望引入全光交换(OCS),实现纳秒级时延。光纤方面,超低损单模用于长距,多芯光纤提升布线密度,空芯光纤衰减更低、时延减少30%,虽成本较高,但微秒级时延节省可提升算力利用率2%–5%,大智算中心收益足以覆盖溢价。RDMA是提升性能的关键技术,通过专用网卡硬件卸载实现内存直传,避免中间拷贝;需配合ECN与PFC两种拥塞控制机制防丢包。目前RDMA主要适用于交换机内部及局域网,RoCEv2支持路由扩展,可在数据中心提供微秒级延迟与极致带宽,但因依赖底层以太网性能,尚不适用于广域网。
算间互联分为域内(10km内)与广域(上千公里)。域内可通过专用光纤承载RoCEv2解决;广域互联则面临零丢包要求极高(1%丢包即致RoCEv2吞吐归零)、时延敏感(600公里时吞吐可由100G骤降至10G)、拥塞控制滞后(RTT达数十毫秒)、ECMP哈希算法失效导致链路拥塞加剧等四大挑战。拥塞控制方面,可采用长距PFC+IPCN、HPCC、RRCC、TC-SACK等机制,并部署边缘流量整形与独立缓存分区;负载均衡方面,改用全局调度控制器实时感知全网状态,为每条流量锁定最优路径,通过精细分流将大象流拆小、动态分配至多链路,结合端口分组、接口ID Hash与智能编排动态调权,实现无损均衡。光网络底层传输协议正从L3向L1逐层适配AI需求,目标构建‘智能光网络 + 开放可编程光层 + 数字孪生仿真 + 物理/IP层协同’底座。
相关技术已在多个国家级示范工程中落地验证。‘京数西算’项目中,北京利用西宁算力开展数据加密训练与非敏感推理,兼顾数据安全与绿电降本约30%,应用于政务大模型、城市仿真与科研AI等场景。跨域协同采用‘边传边算、分段接力’模式:哈密—深圳4000km专线通过URDMA/OTN-RDMA预判+逐跳波长级流控+骨干节点超大缓存,将丢包率压至10⁻⁹以下,训练效率超90%;上海—济南1500km链路结合RoCEv2+AINET+SRv6动态调整通信与计算节奏,效率达95%以上。算电协同方面,中国电信800km 400G骨干专线项目中,福建依托低价风电/光伏部署AI计算中心承接上海迁移任务,上海60kW推理任务迁移后负荷降低80%,结合BBRv3+ECN+DCTCP保障跨省密文数据高吞吐、低时延传输。
邬贺铨总结指出,面对智能体时代流量结构剧变,网络与算力关系正深度融合;通过光、IP、管控、业务四层深度协同,传统网络正从传输管道升级为按需分配、智能调度的‘算力延伸底座’;光网络技术发展正驱动链路层、网络层和传送层创新,通信网络技术体系随AI实现代际跃迁。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



