拆解5家头部国产大模型2026年到底在布什么局?
文|赵艳秋
今年开年以来,国产大模型企业的动作密度之高、变化起伏之大,连业内人士都直言“看不清”。新模型口碑转化、上市公司市值暴增、大厂组织重组……信号混杂,让人难以判断这些动作背后的原因。
一位业内资深人士告诉数智前线,看清楚的方式之一,是先建坐标系。主流国产大模型的战略重心,可以用两组维度交叉划分:国内vs国外、B端vsC端——由此构成四象限,每家公司取舍逻辑一目了然。
在这个坐标系内,2025年全球大模型市场已跑出三条最赚钱的路径:以OpenAI为代表的通用助手路线,率先完成C端规模化;以Anthropic Claude为代表的代码与智能体路线,Claude Code的爆发成为当下最有商业价值的赛道;视频生成作为Token消耗第一大户,也是正在高速兑现的第三极,三条路径目前并列领跑。
国产模型企业如何在这张图上布局自己的位置?数智前线进行了逐一拆解。
01
MiniMax:从C端信仰者到B端入局者
港股上市的MiniMax股价很猛,引发业界关注。去年以来,其商业版块处于调整中——以海外ToC产品起家后,开始发力企业级市场。2025年,其社交应用Talkie等C端产品占公司收入七成,企业级市场增长至三成。
今年3月,MiniMax亮相华为合作伙伴大会,这是一个聚焦政企业务的生态大会。近期有消息称,原华为云中国区副总裁胡维琦加入MiniMax,分析认为她的加盟或将加强MiniMax的企业级业务及中国区市场。
MiniMax商业版块调整的原因在于加强造血能力。接近MiniMax的人士告诉数智前线,尽管C端产品具有规模化潜力,但海外C端用户付费也有增长天花板,且毛利率不高,不容易建立如抖音般流量规模和印钞机的安全边际,难以支撑公司持续规模化盈利能力,正如OpenAI的ARR收入被Anthropic赶超。在这种情况下,MiniMax加大了B端市场开拓。
值得注意的是,MiniMax创立初期,曾主动回避企业级市场。创始团队闫俊杰和贠烨祎曾完整经历了AI 1.0时期的发展历程,认为国内ToB市场常陷入做重度定制的泥潭,投入产出比极低。他们也期望避免让大模型沦为像人脸识别算法那样没有壁垒、免费附送的技术。因此,MiniMax早期定位C端,起用95后产品经理,选择字节也没有必胜把握的社交产品,找到能让用户买单的差异化路径。
而从目前MiniMax在企业级市场的拓展来看,一个业务是视频生成,布局路径与字节旗下产品有所类似。例如与芒果TV合作文化出海,通过音视频融合技术让出海热剧不仅“讲外语”,口型也能对得上;与优酷合作,上线纯AI短剧;在央视节目中,利用视频模型“海螺”为歌手生成AI的动态背景。
另一业务是ARC(Agent、Reasoning、Coding),其为国产大模型带来了新的ToB商业模式——从之前定制化的重资产模式,走向轻量级标准化API调用。这为国产大模型企业开拓ToB市场带来有利条件。MiniMax M2.5在开发者聚合平台OpenRouter的模型输出价格,是Claude Opus 4.6的1/20左右,定价策略反映其积极布局姿态。据OpenRouter数据,MiniMax有两款模型在本周的调用量位居前五。
而随着业务量攀升,单纯依赖公有云已面临性价比和效率瓶颈,难以针对自身模型灵活调整训推框架。为此,MiniMax也在投入线下数据中心建设,部分转向自研训练和推理框架的AI Infra。
02
智谱:从什么都做到专注代码
今年开年以来,智谱在Coding模型上的声势持续升温。GLM-5.1发布后,配套的Coding Plan订阅一度“瞬间断货”,每天定时抢购,大量用户抢购不上,需求明显大于供给。然而,在OpenRouter上,智谱GLM-5系列定价在3到4美元/百万Token,高于多数国产模型,其OpenRouter调用量已不在前十之列。
接近智谱的资深人士告诉数智前线,这是智谱的渠道策略,OpenRouter作为补充渠道,核心流量导向自家平台。从财务数据来看,Coding相关收入增速较高,产品口碑被认为已反超国内几家大厂。但几家头部国产Coding模型与全球领先的Claude仍有较大差距。
智谱能在Coding上突破,有多重因素叠加:其一,智谱是国内最早布局大模型和Coding模型的企业之一,核心实验室团队规模达两百多人,人才密度较高。其二,2025年DeepSeek爆火后,国内多家公司反思基础模型研发的重要性,智谱也加大了基础模型投入。其三,战略层面主动收缩。此前智谱内部对标OpenAI,广泛布局各类模型,业务分散,去年起逐步聚焦,将资源集中于代码方向,转成为“中国版Anthropic”的B端服务叙事。
在其去年发表的论文中,有业内人士发现其重点探讨了ARC(Agent、Reasoning、Coding)。技术节点上,GLM-4.7于2025年12月发布,在编程与推理上实现跃升,是其口碑开始上升的重要节点。
商业化层面,智谱此前企业级收入高度依赖项目定制开发,本地化部署占2025年营收的73.7%(约5.34亿元)。但数智前线获悉,智谱唐杰教授团队对MaaS平台长期价值比较坚定,虽然这一模式在国内市场此前推进并不顺畅。Coding需求爆发成为转折点,标准化API订阅快速放量,为MaaS路径打通了商业闭环,也为智谱等国内模型企业提供了更具说服力的增长叙事。目前智谱定制化业务维持现金流,API订阅作为第二增长曲线开拓。
值得关注的是,需求快速增长也对智谱基础设施提出挑战,宕机与响应变慢的问题时有发生,算力扩容与运维能力仍是待补的短板。
03
字节:"控价保利"押注两大高Token场景
今年开年,字节在AI商业化的核心叙事,仍高度集中于Token消耗规模。4月于武汉举办的火山引擎开年巡展上,字节公布截至2026年3月,豆包大模型日均Token使用量突破120万亿,这一全口径数据涵盖豆包App、火山引擎API、字节系产品内嵌AI及企业客户调用的全部消耗量。
在模型方面,字节将模型支撑重心明确指向两大高Token消耗场景:视频创作与智能体应用。其中在视频方向上,春节前发布的Seedance 2.0是关键节点。此前受制于20%~30%的“抽卡率”,AI短剧与漫剧难以实现全自动化投产。字节内部人士曾告诉数智前线,“抽卡率跨过50%,才能产生显著商业价值”。Seedance 2.0发布后,抽卡率有明显改善,具备突破这一商业化门槛的可能。
Seedance 2.0在企业级市场开放经历了一段合规准备期——初期以嵌入即梦、豆包等自有C端产品的形式对外提供服务,待版权IP等保护机制逐步完善后,火山引擎于4月2日开放API公测,并于4月14日全面上线。
智能体方向,字节也将OpenClaw类应用列为重点押注场景。火山引擎CEO谭待介绍,目前国内该类产品用户盘仍在百万量级,但面向中国职场人群的庞大基数,规模化增长空间较大。值得关注的是,在龙虾应用中,字节仍优先推荐自家大模型,被业界解读为在基础模型层构建核心壁垒的长线布局。
大厂能否在AI时代真正拿到竞争“船票”,必须具备较强的模型。业界观察到,字节在大模型上并未操之过急,依然在做原创和基础性研究。一个例子是DeepSeek的mHC论文,即在字节2024年提出的HC(超连接)技术基础上完成关键优化。但业界也认为,包括字节在内的国内大厂目前在ARC(Agent、Reasoning、Coding)方向上的投入仍不足。
从模型调用来看,据媒体报道,字节旗下云业务火山引擎2026年MaaS业务收入目标已从2025年的20亿元量级,大幅上调至百亿元规模,大模型及相关AI工具销售成为销售端核心考核指标。为在生态层面占据主导,火山引擎近期宣布赞助支持OpenClaw官方技能商店ClawHub的中国镜像搭建,意在借助这一全球热门平台争夺开发者心智。
定价策略上,字节出现转向。过去两年,火山引擎在春季持续推出API调用降价,以价换量扩大市场份额。今年,在多家大厂相继宣布涨价的背景下,火山引擎转向“控价保利”——收紧优惠、暂停首购特惠、取消部分补贴等,Seedance 2.0价格也高于前代。这一转变意味着,模型带来的价值更高,变现效率的优先级也正在提升。
04
阿里:组织重构,从“卖算力”到“卖Token”
今年开年以来,阿里围绕AI展开了一次大规模组织重构。3月16日,集团宣布成立ATH组织(Alibaba Technology Holdings),由CEO吴泳铭挂帅,将通义实验室、MaaS业务线、C端千问事业部、B端悟空事业部及AI创新事业部整合于一体,目标指向“创造Token、输送Token、应用Token”。
外界认为此次调整最具信号意义的是,通义实验室从阿里云下属研究部门升格为与电商、云并列的独立事业部,MaaS也从云业务中独立拆分——过去AI能力附属于云计算体系,此番战略调整将AI升级为集团层面的核心。同时,阿里设立“集团技术委员会”,将AI决策权与资源调配提升至集团最高层。数智前线了解到,自去年下半年起,阿里已着手围绕AI整合内部分散条线,核心命题是商业模式从“算力即服务”向“Token即服务”的转型。
模型层面,今年3月底至4月初短短四天内,阿里接连发布三款模型,并优先接入悟空、Qoder、千问App等内部生态,以内部消耗的方式验证模型商业价值。闭源API调用的业务边界扩大,业内看法不一:有人担忧开源路线收缩;有人认为纯开源难以直接转化为商业收益,阿里转向分层次开闭源是变现逻辑下的现实选择;也有资深人士指出,开源本质上是追赶者的竞争策略,对全球头部模型公司而言从未是核心战略重心,Anthropic未官宣开源,OpenAI与谷歌虽有过开源,但均为内部小团队行为,且不具持续性。
在更长周期的目标上,阿里制定了未来五年云与AI商业化年收入突破1000亿美元的目标,对应需维持47%以上的年均复合增长率。这一数字意味着,阿里需要将前期大规模研发投入,转化为可持续的规模化营收,破解此前“叫好不叫座”的局面。
05
DeepSeek:慢或是假象,留人才是真问题
DeepSeek最近又被催更。过去一年多,DeepSeek未推出大版本更新,技术迭代节奏慢于业界预期。但以豆包1.0到2.0历时21个月为参照,DeepSeek的节奏并不算异常。2月已将上下文窗口扩展至100万Token;3月底长达12小时的服务中断,外界有判断是新旧架构切换,是主动升级的代价;4月8日灰度上线的“快速模式”与“专家模式”,应用体验提升,也被业内认为是下一代旗舰模型V4发布前的关键预热。过去一段时间,论文产出呈现出较踏实的基础研究风格。
资深人士看到,DeepSeek最初从Coding模型起步,经数学模型到大语言模型和推理模型突破,技术路线清晰。V4将是一个万亿参数级别、支持文本、图像、视频等多模态的产品。
然而,值得关注的是最近曝出的人才流失。2026年3月,DeepSeek核心模型主力作者之一郭达雅离职,随后加入字节跳动Seed团队。此人是DeepSeek-R1的第一作者。
一些资深人士认为,这指向了一个结构性问题:DeepSeek无上市计划,也未启动外部融资,在激励层面很难发力。在一个顶尖AI研究员身价堪比球星的市场,这套机制难以支撑长期留人。同时,团队对外部交流管理较严,商业化路径战略不足,或让年轻研究员心存发展顾虑。业界有判断,一旦启动融资,其估值不会低于MiniMax与智谱。有业界人士认为,能否在人才与商业化上适度打开局面,或许是梁文锋下一阶段需要思考的命题之一。
此外,腾讯方面,去年将年轻研究员姚顺雨引入并赋予高度自主权,主导自研模型,业界在等待其新模型发布;同时,腾讯在AI基础设施上也需要追赶其他几家大厂。
华为盘古经历了一轮内部职能重组,大模型研发一部分划入2012实验室,另一部分并入终端业务线,华为云同时提出“行业AI梦工厂”,布局具身智能、智能制造等垂直领域。业界也提到,大模型与华为此前的业务类型,一种靠快速迭代创新,一种靠流程制度保障极致可靠安全,如何平衡让年轻的AI人才保持活力、发挥价值需要探索。
百度方面,4月14日发布新一代多模态基础模型等,并推进昆仑芯和“龙虾”为代表的智能体应用。这几家大模型企业的动向值得进一步跟踪观察。



