“Token”时代,云厂商的生存法则变了

来源 | 伯虎财经(bohuFN)

作者 | 楷楷

开年至今,全民掀起了一股“龙虾热”,以OpenClaw为代表的开源AI智能体迅速走红,全球用户忙着养数字员工“干活”,Token消耗量呈指数级暴涨。

为此,英伟达CEO黄仁勋表示发Token当工资;阿里、腾讯也纷纷将Token作为员工福利,这事听起来似乎有点魔幻,但随着Token价格水涨船高,“算力即薪酬”的预言也快成真了。

近日,阿里云、百度云、腾讯云相继对AI算力、存储等相关产品进行调价,最高涨幅超30%。今年1月,亚马逊AWS、谷歌云已先一轮涨价,打破了云计算行业“只降不升”的定价惯性。

云巨头们的涨价理由也高度一致:算力需求持续攀升,核心硬件及相关基础设施成本显著上涨。简单来说,算力的供给已经赶不上消耗。

国家数据局指出,2024年年初,中国日均Token调用量为1000亿;到今年3月,调用规模已突破140万亿,两年增长超千倍,一场“Token革命”正在照进现实。

当AI时代的竞争从“拼模型”转向“争算力”,科技大厂也在加速重构战略版图,谁能更高效地“燃烧”Token,谁就将掌握未来商业的定价权。

01 云厂商集体“涨价”

Token为什么一下子变得金贵?先搞清楚什么是Token。

Token是AI处理信息时最小的一份“计算单位”,当我们将一句话、一段代码、一张图片交给AI时,它会被切割成一个个Token,大模型再去理解、预测和生成。

简单来说,我们可以将Token理解为发电厂里的计量单位“千瓦时”,用电(使用大模型)越多,电费(消耗的Token)自然越贵。

但Token早期并不贵,甚至是免费的。

2022年底,ChatGPT用大语言模型推开了通用人工智能(AGI)的大门。在接下来的一年里,国内外科技大厂纷纷自研通用大模型,Token的消耗开始被摆上了台面。

国盛证券基于参数数量和token数量估算,GPT-3训练一次的成本约为140万美元;一些更大的LLM模型,训练成本则介于200万美元至1200万美元之间。

虽然训练成本不菲,但在2024年,阿里、字节、百度等大厂不仅采取C端免费的策略,更在B端市场掀起了一场血腥的价格战,将API调用价格从“分”打到“厘”。

在大模型刚刚爆发的窗口期,行业的普遍共识是算力将会越来越便宜,甚至会像如今的宽带资源一样,成为互联网基础设施。

在这样的基础上,大厂依然沿用互联网思维来推演,将模型能力视为入口资源,先通过极低价格吸引开发者与企业入场,争取在商业化落地的过程中获得先发优势。

但剧情并没有如想象般发展。“百模大战”开打仅一年便匆匆落幕,大厂开始意识到,生成式对话所能带来的商业价值有限,大模型要在垂直场景“用起来”,才能释放更多的竞争力。

然而,当AI从“训练”转向“推理”,每一次对话、生成、推理都需要进行新的计算,这意味着Token的需求曲线不再是线性的,而是呈指数级增长。

Claude Code、OpenClaw 等编程智能体的出现,更进一步加大了对Token的需求——智能体可以全年无休地工作,每个智能体还能生成成百上千个子智能体来处理任务的不同部分。

有开发者报告指出,从chatbot到Agent,单次任务的算力消耗将会被放大30-100倍,极端场景下将可能放大1000倍以上。

举个例子,一名学生借助AI完成一篇7500个单词的论文,在不需要修改的情况下,大概要消耗1万个Token,按此推算,单纯的文本对话,一天消耗百万个Token已经算很多了。

但智能体执行一个简单的任务,可能就要触发上百万的Token消耗。有用户表示跑半天OpenClaw,就花掉了5000万Token;还有用户表示用OpenClaw编程,一个月烧掉上千刀。

随着Agent成为更广泛的大众需求,用户也学会了货比三家,更便宜的国产模型开始席卷全球开发者社区,成为了这一轮Token大爆发的最大受益者之一。

前段时间,多家媒体援引知情人士透露消息,称Kimi近20天累计收入已超过2025年全年总收入;刚刚登陆资本市场的Minimax和智谱,股价也再创新高。

但问题是,随着海内外用户的疯狂涌入,Kimi已经隔三差五跳出“高峰时段算力不足”的提示,MiniMax则直接宣布限流……

归根到底,此类国产小模型自己并不拥有GPU,它们想赚“龙虾热”的钱,还要看背后阿里云、腾讯云、火山引擎等云厂商的定价。

可算力的成本也不便宜,GPU市场早已供不应求,当大厂卖Token的收入增速追不上建数据中心的花钱速度,涨价也是必然之举。

02 竞逐“Token工厂”

过去一年,由于Token需求激增,云厂商的收入也翻了几番。

根据多家媒体报道,火山引擎2025年已完成超200亿元的营收目标,2024年的收入则超120亿元;根据阿里2026财年Q3财报,阿里云收入加速增长36%,增速创三年新高,AI相关产品收入连续第十个季度三位数增长。

但我们不能只看收入不看投入。2025年,阿里的资本支出为1238亿;根据金融时报报道,字节的资本开支约为1500亿,仅靠“卖算力”的话,何时才能填平这笔账?

科技大厂显然并不甘心只当“卖铲人”,既然Token是未来AI竞争的“硬通货”,它们更希望能掌握Token生产、调度和变现的全链路,成为智能时代的“水电煤”。

黄仁勋在英伟达GTC 2026大会上描绘出新的蓝图,他认为英伟达将要从一家“芯片公司”向“AI基础设施和工厂公司”蜕变,不再只是“卖芯片”,而是成为一家“Token工厂”。

目前,英伟达有意通过收购Groq补齐推理短板,其全新发布的Vera CPU能对智能体AI系统进行实时调度与协同,再加上CUDA这个生态护城河,以及其和电力巨头合作打造的新一代AI工厂,未来所有Token从诞生到消耗,都得从英伟达的“Token工厂”里面跑一遍。

根据黄仁勋的分层定价策略,Token的定价将跟算力产出直接挂钩——能力越强,速度越快,定价越贵,而英伟达则握住了这套体系的路线图与定价权。

阿里与英伟达的战略方向也颇为类似,但阿里不仅希望成为Token供应商与基础设施运营商,还希望探索更多新业务,让Token能够被消耗得更多。

近日,阿里成立 Alibaba Token Hub(ATH)事业群,由吴泳铭直接带队,以“创造Token、输送Token、应用Token”为核心目标,进一步强化AI业务战略协同。

之后,阿里推出了企业级AI原生工作平台“悟空”,剑指的是B端市场,首批覆盖电商、设计、制造、财税等十大场景,是能够真正嵌入企业工作流的数据军团。

重新回归阿里的钉钉创始人陈航指出,Token经济学的价值,不在于用机器取代人,在于把这部分庞大的人力资源成本,转化为可放大10倍、100倍的数字生产力。

这跟上一轮企业通过SaaS(软件即服务)提高经营效率的目标是一致的,但SaaS模式主要用于维持运转,而基于Maas(模型即服务)搭建的“悟空”,则能带来可量化的业务增长。一旦企业将算力和数据沉淀在阿里体系,其迁移成本还会越来越高,最终形成核心壁垒。

拥有类似想法的还有字节旗下的火山引擎,其一直将Maas 放在了很高的战略位置,希望以MaaS带动云业务的全面突围。

火山引擎的优势在于,字节拥有抖音、剪映等国民级应用,在如此土壤下跑出的生图、生视频模型能迅速在亿级用户场景中完成验证与迭代,形成“算力-模型-场景”的闭环优势。

比如Seedance 2.0模型凭借突破性能力迅速出圈,不仅吸引了海量用户涌入,更在漫剧等专业场景中实现了规模化落地,直接推动了火山引擎Token消耗量的激增。

根据《晚点 LatePost》的报道,字节火山引擎的豆包大模型日均调用量已超过 100 万亿 Tokens,成为全球第三家Token消耗量过百万亿的云厂商。

不过,国内的云厂商们也不会坐以待毙。阿里CEO吴泳铭表示,新成立的ATH事业群的目标是拿下2026年国内AI云市场增量的80%。

目前,在中国AI云市场中,阿里云以35.8%的占比位列第一;火山引擎以14.8%的占比位列第二。Token争夺战一触即发。

03 Token成为“流通货币”

虽然路径不同,但科技大厂的战略布局都指向同一个事实:

AI时代的竞争,已不仅仅是模型能力的比拼,科技大厂争夺的是一套Token生产、分发与应用体系的话语权,谁掌握了Token的定价权,就相当于掌握了AI时代最值钱的生产资料。

从前,科技大厂抢夺的是用户的注意力;未来,Token从哪里产生,流向哪里,如何被消耗,才是它们更关注的事情。

首先,以更低成本生产高质量Token。过去,互联网行业的“护城河”是数据、算法、规模等轻资产叙事,但在未来,大厂则要重新拥抱“重资产”,将算力基建作为新的战略高地。

中国有着廉价且稳定的电力供应,再加上科技企业在芯片、模型架构等方面的突破,天然有着算力出海优势,这一轮云厂商集体涨价,也释放出云厂商向全球市场要利润空间的信号。

其次,抢夺Token分发权。大厂掌控着大模型技术,能够将底层算力转化为标准化、可调用的Token服务,进一步降低了用户调用模型能力的门槛。

比如阿里“悟空”切入企业工作平台;微信推出插件支持接入 OpenClaw等,只要用户来部署了,后续自然就会有源源不断的Token消耗,大厂要争抢的是新一轮的“Token入口”。

最后,刺激Token的消耗。拥有Token不一定能形成商业闭环,还要将模型能力嵌进真实业务场景,才能带来可持续的Token消耗。

长远来看,“Token工厂”要的是“消耗-产出”的转化效率,其核心不是卖一次性算力,而是把Token消耗和客户价值真正绑定,能够稳定地、可持续地创造商业收入。

但规则不会一成不变,AI的发展速度已经远超人类想象,没人能预知未来,就像几年前没人能预测到OpenClaw会突然爆火一样。

因此,无论是科技大厂,还是垂直模型公司,又或者是agent工具开发者,大家都还需要在各自擅长的领域,一边奔跑,一边补课。

大厂想要把AI这个虚的概念,变成实的生意,将不再只是参数竞赛,也不是单纯比拼Token的消耗,其最终总会遵循一个最朴素的逻辑:普通人能用好的AI,才是最有价值的AI。

AI 时代真正的商业化入口,可能很近,也可能还有很远。

特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)

标签: Token AI
“Token”时代,云厂商的生存法则变了
扫描二维码查看原文
分享自DoNews
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1