罗福莉评Anthropic限制OpenClaw调用:终结token虚假狂欢

小米MiMo大模型负责人罗福莉就Anthropic调整OpenClaw调用方式发表分析,指出Anthropic并未封禁OpenClaw,而是终止其通过Claude Pro等固定订阅模式调用模型的能力,仅保留官方订阅及按量计费API两种合规路径。

罗福莉认为,该调整直指当前第三方Agent工具普遍存在的token低效消耗问题。她以OpenClaw为例说明,其上下文管理机制导致单次用户查询触发多轮低价值工具调用,每轮作为独立API请求发出,携带上下文常超100K tokens,实际请求次数达Claude Code原生框架数倍,折算API成本约为订阅价数十倍。

此外,OpenClaw等第三方harness在接近上下文长度上限时频繁压缩工具返回结果,破坏Claude缓存机制所依赖的上下文前缀一致性,致使cache命中率极低,模型被迫重复全量读入,进一步推高token消耗。两重问题叠加,使每次查询的实际token开销趋近理论极值。

OpenClaw用户群体高度集中于重度使用者,且即便轻度用户经由该harness发起的请求,在成本结构上亦等同于重度用户,导致订阅制赖以成立的用户使用分布假设彻底失效,补贴逻辑瓦解,Anthropic单方面承担不可持续的成本缺口。

罗福莉指出,短期成本冲击具有正向工程引导作用:第三方harness开发者将被迫优化上下文管理、提升prompt cache命中率、削减无效token消耗。订阅制曾使开发者无需为单次请求token成本负责,而API按量计费则将‘优化效率’从可选项转变为商业刚性需求,实现外部成本内部化。

她警示,单纯围绕token消耗展开的价格战难以为继。低价售卖token并全面开放第三方接入看似利好用户,实则构成陷阱——平台为弥补亏损可能降配模型、限流或降低推理稳定性,最终损害用户体验与留存。Coding Plan类订阅本质是按周期与请求次数粗放分配额度,开发者无法感知单次请求真实成本,低效harness造成的算力浪费由平台隐性承担。

罗福莉介绍小米MiMo采取不同路径:推出Token Plan,按实际token消耗量配额,以Credit为单位销售token额度。无论使用原生框架或OpenClaw等第三方harness,每个被浪费的token均直接扣除用户额度,平台不再为低效实现买单,用量与成本关系重新透明化。

她强调,此举并非禁止第三方接入,而是以计费结构本身作为约束机制,驱动生态向高token效率方向演进。低价订阅的根本缺陷在于切断用量与成本间的信号传导,未厘清定价逻辑即盲目跟进,复制的或是Anthropic刚脱离的困境而非优势。

罗福莉将此次调整置于更宏观技术演进框架下:全球算力供给增速已落后于Agent场景下token消耗增速。真正出路不在于更廉价的token,而在于协同进化——更高token效率的agent harness,乘以更强大、更高效的模型。Anthropic此次调整客观上推动开源与闭源生态共同转向‘每token完成多少有效工作’这一新竞争维度。算力竞赛叙事在Agent时代已失效,下一阶段竞争核心是算力使用聪明度,而非绝对消耗量。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1