邬贺铨院士：智能体时代光网络迎来代际跃迁- DoNews

在6月4日举行的中国光网络研讨会上，中国工程院院士邬贺铨发表《智能体时代的光网络》主题演讲，系统阐述大模型智能体规模化应用对数字基础设施提出的新挑战，并聚焦入算网络、算内互联与算间互联三大层级的技术演进路径。

邬贺铨指出，随着大模型智能体（Agent）从概念走向规模化部署，Token调用量显著攀升，算力需求持续走高。预测显示，2030年全球IP流量年均增长60%~90%，其中AI流量占比将超60%；该类流量对丢包率与时延高度敏感，传统IP网络难以满足要求。

针对算力类型差异，他强调超算不宜做智算、智算不宜做通算；通算无法胜任智算、智算精度不足亦难承担超算任务。当前互联技术按层级分层选型：卡间互联优选CPO、LPO、OCS；机间互联采用Spine-Leaf架构，适配800G/1.6T可插拔光模块（OSFP）、硅光集成及DWDM+OTN；算间互联则依托DWDM+OTN、相干硅光高速光模块、广域RoCEv2+全域无损调度、光电路交换OCS、算力路由协议与SRv6算力切片等技术。

入算网络作为用户侧数据进入智算中心的通道，面临7×24小时运行与B端企业日均百万至亿级Token消耗带来的上行带宽瓶颈，且不同场景对时延与数据隐私要求差异显著。中小企业及高端个人用户本地接入以对称50G PON为主流方案；针对实时性要求高的业务，2000km往返基础物理时延约20ms，叠加处理后普遍超25ms，难以满足<20ms需求。应对措施包括：区分业务类型，允许30~100ms延迟业务远程处理；架构优化，在东部完成意图识别与轻量化预处理，仅向西部传输核心算力诉求并缓存常驻模型；技术升级，关键业务采用空芯光纤降低时延约30%，FC-NVMe实现设备+协议延迟低于1毫秒，短距低成本场景选用RoCEv2。

算内互联正向全光扁平架构演进，叶脊结构支撑千卡以上GPU集群，系统速率将从400G迈向2026年的1.6T、2028年的3.2T。光模块由可插拔800G逐步过渡至2026年近封装（NPO）与共封装（CPO），后者功耗降50%、密度升10倍；2028年后有望引入全光交换（OCS），实现纳秒级时延。光纤方面，超低损单模用于长距，多芯光纤提升布线密度，空芯光纤衰减更低、时延减少30%，虽成本较高，但微秒级时延节省可提升算力利用率2%–5%，大智算中心收益足以覆盖溢价。RDMA是提升性能的关键技术，通过专用网卡硬件卸载实现内存直传，避免中间拷贝；需配合ECN与PFC两种拥塞控制机制防丢包。目前RDMA主要适用于交换机内部及局域网，RoCEv2支持路由扩展，可在数据中心提供微秒级延迟与极致带宽，但因依赖底层以太网性能，尚不适用于广域网。

算间互联分为域内（10km内）与广域（上千公里）。域内可通过专用光纤承载RoCEv2解决；广域互联则面临零丢包要求极高（1%丢包即致RoCEv2吞吐归零）、时延敏感（600公里时吞吐可由100G骤降至10G）、拥塞控制滞后（RTT达数十毫秒）、ECMP哈希算法失效导致链路拥塞加剧等四大挑战。拥塞控制方面，可采用长距PFC+IPCN、HPCC、RRCC、TC-SACK等机制，并部署边缘流量整形与独立缓存分区；负载均衡方面，改用全局调度控制器实时感知全网状态，为每条流量锁定最优路径，通过精细分流将大象流拆小、动态分配至多链路，结合端口分组、接口ID Hash与智能编排动态调权，实现无损均衡。光网络底层传输协议正从L3向L1逐层适配AI需求，目标构建‘智能光网络 + 开放可编程光层 + 数字孪生仿真 + 物理/IP层协同’底座。

相关技术已在多个国家级示范工程中落地验证。‘京数西算’项目中，北京利用西宁算力开展数据加密训练与非敏感推理，兼顾数据安全与绿电降本约30%，应用于政务大模型、城市仿真与科研AI等场景。跨域协同采用‘边传边算、分段接力’模式：哈密—深圳4000km专线通过URDMA/OTN-RDMA预判+逐跳波长级流控+骨干节点超大缓存，将丢包率压至10⁻⁹以下，训练效率超90%；上海—济南1500km链路结合RoCEv2+AINET+SRv6动态调整通信与计算节奏，效率达95%以上。算电协同方面，中国电信800km 400G骨干专线项目中，福建依托低价风电/光伏部署AI计算中心承接上海迁移任务，上海60kW推理任务迁移后负荷降低80%，结合BBRv3+ECN+DCTCP保障跨省密文数据高吞吐、低时延传输。

邬贺铨总结指出，面对智能体时代流量结构剧变，网络与算力关系正深度融合；通过光、IP、管控、业务四层深度协同，传统网络正从传输管道升级为按需分配、智能调度的‘算力延伸底座’；光网络技术发展正驱动链路层、网络层和传送层创新，通信网络技术体系随AI实现代际跃迁。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。