英伟达转向Lepton算力平台应对云竞争

即便市值突破4万亿美元,英伟达仍被大大低估。尽管在外界印象中仍是GPU“核弹厂”,但其AI芯片之外,始终怀有云平台野心。

2023年,英伟达推出DGX Cloud,单台实例配备八块H100,月租36999美元,被视为挑战AWS、Azure的信号。然而到2025年中,该服务悄然退出C位,数十亿美元云支出承诺不再对齐DGX Cloud,转为内部基础设施与研发用途。

取而代之的是2025年上线的Lepton——一个GPU租赁与调度市场型产品。它不直接提供算力,而是作为算力需求的“入口”,连接全球GPU云提供商与AI开发者。

DGX Cloud退场主因在于市场竞争与渠道冲突。2024年下半年起,GPU供应缓解,AWS等云厂商大幅降价,H100和A100实例降幅达45%,削弱了DGX Cloud价格优势。同时,英伟达与核心客户AWS、微软、谷歌形成直接竞争,引发合作伙伴加速自研芯片如Trainium、TPU以降低依赖。

此外,企业多将DGX Cloud视为临时方案,项目启动后即迁回长期合作云平台,难以建立客户黏性。因此,英伟达调整策略,将DGX Cloud转为内用,并推出Lepton避免与云巨头正面冲突。

Lepton模式本质是“算力做市”:不持有GPU库存,仅负责调度需求至AWS、Azure或英伟达系云服务商如CoreWeave、Lambda。用户提交任务后,系统自动匹配H100或Blackwell GPU资源,统一接入NIM微服务与NeMo框架,保障开发体验一致性。

英伟达通过“卖芯片-投资客户-租回服务”构建生态闭环。例如,2023年投资CoreWeave 1亿美元并优先供货H100,随后从其租用算力;2025年9月与Lambda签订15亿美元四年协议,租回1万台搭载英伟达GPU服务器,总价值约13亿美元,用于自身模型训练。

该模式实现收入前置、支出后置,减少自建数据中心压力,同时强化合作伙伴黏性,并为AI算力市场锚定价格预期。Nventures还广泛投资AI初创企业,绑定未来算力采购需求。

Lepton化解了与云厂商的竞争关系,使AWS、Azure等愿意接入。尽管中小云商担忧客户关系与定价权受影响,但主流厂商参与使Lepton影响力不可忽视。

长远看,Lepton可成为AI算力控制面板,掌握任务分布、地域紧张度、GPU使用频率与价格弹性等数据,辅助商业决策。如同苹果通过App Store掌控移动生态,英伟达试图以Lepton掌控全球算力调度入口。

英伟达无需拥有云,只需掌控算力栈与需求入口。只要AI训练依赖其GPU与软件生态,无论算力落在哪家云平台,英伟达都能主导价值链。从硬件到平台,其野心早已超越芯片本身。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1