英伟达确认今年规模部署CPO技术,聚焦千兆瓦级AI工厂能效提升

英伟达网络高级副总裁Gilad Shainer在2月4日举行的网络研讨会上介绍,公司正推进共封装硅光(CPO)技术规模化部署,以应对AI超级计算机日益增长的功耗与可靠性挑战。他指出,现代AI基础设施遵循‘数据中心即计算机’理念,由Scale-up(NVLink互连H100 GPU)、Scale-out(Spectrum-X以太网架构)、上下文内存存储及Scale-across(跨数据中心统一计算)四大支柱构成,目标是构建千兆瓦级AI工厂。

光互连功耗已占计算资源总功耗约10%,成为关键瓶颈。CPO将光引擎集成至交换芯片同一封装内,显著缩短电通道长度、减少信号转换环节,预计在Scale-out场景下实现最高5倍功耗节省——可插拔光模块功耗为20–25瓦,而CPO方案大幅降低该值。除节能外,CPO还减少组件与激光器数量,延长系统‘首次中断时间’,提升整体可靠性。

英伟达已为Spectrum-X以太网平台和Quantum-X InfiniBand平台开发支持CPO的交换机,并协同生态伙伴推进封装工艺、光纤连接方式及液冷设计。CoreWeave、Lambda与德克萨斯高级计算中心(TACC)将于2026年上半年率先部署基于Quantum-2 InfiniBand的CPO系统;Spectrum-X以太网平台CPO产品计划于2026年下半年出货。

针对可靠性疑虑,Shainer强调CPO规避了可插拔光模块易受人为操作(如插拔、清洁、触碰)及灰尘污染影响的问题,整机经100%系统级制造测试验证。英伟达与台积电联合开发的CPO封装工艺注重可靠性和可测试性,采用微环调制小型化光引擎替代传统大尺寸MZM方案,适配高密度AI网络;同步研发光纤自动对准技术与高功率激光器,进一步压缩激光器用量。

对于灵活性质疑,Shainer承认CPO需预选技术规格,但其设计覆盖典型数据中心内部及园区级互联距离,可减少多类型光模块需求;超长距跨城连接仍保留可插拔方案。针对‘按需付费’模式下的成本弹性争议,他指出AI超级计算机普遍追求高利用率与拓扑优化,客户倾向一次性满配部署,CPO由此在资本开支(CAPEX)与运营支出(OPEX)两方面均具优势。超大规模云服务商被视作CPO主要采纳方。下一代演进方向包括更大端口交换机、更高光连接密度与吞吐量、新型光纤-交换机接口及高密度全液冷机架。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1