2026年马年春节期间,国内多家科技企业集中发布新一代人工智能模型。2月11日,智谱发布GLM-5底座模型;2月12日,MiniMax上线并开源文本模型M2.5;2月14日,字节跳动推出豆包大模型2.0系列,包含Seedance 2.0视频模型和Seedream 5.0 Lite图像模型;阶跃星辰此前发布Step 3.5 Flash,阿里已推出Qwen3-Coder-Next,并计划于春节期间发布Qwen 3.5。
本轮发布覆盖文本、图像、视频多模态方向,单条10秒、1080p视频由Seedance 2.0生成需消耗约35万token。行业整体Token消耗量持续攀升:中国日均Token消耗2024年初为1000亿,2025年中突破30万亿,至2026年2月主流大模型合计日均消耗已达180万亿。火山引擎日均调用量从2024年底2万亿增至2025年底63万亿;阿里云外部客户2025年日均调用近5万亿,2026年目标为15–20万亿,内部业务日均调用计划由16–17万亿提升至100万亿。
国联民生证券指出,Token需求正经历结构性“通胀”,即单位时间、单位用户的Token消耗量上升。摩根大通预测,中国AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3900千万亿,五年增长约370倍。
伴随Token需求激增,全球云计算厂商启动涨价周期。亚马逊云上调EC2机器学习容量块价格约15%,谷歌云在北美、欧洲、亚洲全面涨价,优刻得宣布全线产品与服务价格上浮。2月12日,智谱宣布GLM Coding Plan套餐价格体系结构性调整,取消首购优惠,整体涨幅30%起,官方解释为保障高负载下的稳定性与服务质量,同步加大算力与模型优化投入。该套餐上线即售罄。
分析指出,Token正成为大模型时代核心计量单位,其消耗在编程、Agent、企业流程等场景中呈现刚需特征。产业定价逻辑由此转向以推理消耗为基准的分层订阅模式。券商建议关注三类方向:云厂商与算力基础设施、具备高ROI场景留存能力的大模型厂商、以及面向企业AI工作流的安全治理与运行时防护工具。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



