2026春节档国产AI密集发布，行业Token消耗达日均180万亿- DoNews

2026年马年春节期间，国内多家科技企业集中发布新一代人工智能模型。2月11日，智谱发布GLM-5底座模型；2月12日，MiniMax上线并开源文本模型M2.5；2月14日，字节跳动推出豆包大模型2.0系列，包含Seedance 2.0视频模型和Seedream 5.0 Lite图像模型；阶跃星辰此前发布Step 3.5 Flash，阿里已推出Qwen3-Coder-Next，并计划于春节期间发布Qwen 3.5。

本轮发布覆盖文本、图像、视频多模态方向，单条10秒、1080p视频由Seedance 2.0生成需消耗约35万token。行业整体Token消耗量持续攀升：中国日均Token消耗2024年初为1000亿，2025年中突破30万亿，至2026年2月主流大模型合计日均消耗已达180万亿。火山引擎日均调用量从2024年底2万亿增至2025年底63万亿；阿里云外部客户2025年日均调用近5万亿，2026年目标为15–20万亿，内部业务日均调用计划由16–17万亿提升至100万亿。

国联民生证券指出，Token需求正经历结构性“通胀”，即单位时间、单位用户的Token消耗量上升。摩根大通预测，中国AI推理Token消耗量将从2025年的约10千万亿增长至2030年的约3900千万亿，五年增长约370倍。

伴随Token需求激增，全球云计算厂商启动涨价周期。亚马逊云上调EC2机器学习容量块价格约15%，谷歌云在北美、欧洲、亚洲全面涨价，优刻得宣布全线产品与服务价格上浮。2月12日，智谱宣布GLM Coding Plan套餐价格体系结构性调整，取消首购优惠，整体涨幅30%起，官方解释为保障高负载下的稳定性与服务质量，同步加大算力与模型优化投入。该套餐上线即售罄。

分析指出，Token正成为大模型时代核心计量单位，其消耗在编程、Agent、企业流程等场景中呈现刚需特征。产业定价逻辑由此转向以推理消耗为基准的分层订阅模式。券商建议关注三类方向：云厂商与算力基础设施、具备高ROI场景留存能力的大模型厂商、以及面向企业AI工作流的安全治理与运行时防护工具。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。