文:李浩
编辑:经纬
一日不见,如隔三秋。这句话在 AI 领域也非常适用。
随着技术的成熟、用户的接受、资本的站队,AI 大厂之间的比拼从排位赛转向淘汰赛。
模型性能、用户流量、品牌知名度、资本声量、落地进度……所有维度都在以月,甚至以星期为单位快速迭代。一家企业今天还站在聚光灯下,几个月后就可能被迅速甩开,甚至悄然掉队。AI 排名网站 LLM Arena 上常常会出现几家大厂谁更新了一个版本,谁就能成为国内大模型性能第一的情况。
在这样的战场上,争分夺秒成为常态。一次战略误判、一次融资的延误、一次技术掉队、甚至一次核心团队人员变动,往往就意味着从领先集团滑落到第二梯队,甚至可能被彻底淘汰出局。
在 2024 年的百模大战中,阶跃星辰并没有持续的亮眼表现。它推出过“跃问”助手和“冒泡鸭”角色扮演产品,但并未在 C 端掀起波澜。很多人把它归为“六小龙”中相对低调的一员,甚至一度认为它会成为又一个默默掉队的玩家。
但是 5 月 29 日,阶跃星辰发布并开源了 Step 3.7 Flash。该模型总参数接近 200B,激活参数却只有约11B,最高生成速度达到 400 Tokens/s。在 Artificial Analysis 的综合评测中,它拿下了输出速度、端到端响应、性价比等多项第一。
从早期探索失利,到战略聚焦,再到资本补票,阶跃星辰用 18 个月时间完成了从“多模态卷王”到“高效 Real-World Agent 玩家”的跃迁。
跌倒与跌倒之后
虽然当前阶段,动辄以百亿为投资单位的 AI 行业,有资格“刷脸”的玩家都不会太缺“余粮”。但是业内,仍不乏诸多新秀销声匿迹的故事。
比如 DeepMind 联合创始人 Mustafa Suleyman 创立的 Inflection AI。Inflection AI 曾以 Pi 聊天机器人和高调融资,成为 OpenAI 最直接竞争者之一。但 2024 年后即使曾经顶着 Mustafa 的大神光环,Inflection AI 也未能走出自己的道路。最终核心团队转投 Microsoft,公司也从明日之星变为查无此人。
聊天机器人,有 ChatGPT、Gemini、Claude 等大佬压制,有已经被同行炒上天的获客成本,小厂却难以形成足够强的技术壁垒。C 端机器人的“阵亡率”一度冠绝其他 AI 赛道。Character.AI、Jasper、Copy.ai、Tome 等国外一度爆火的产品,曾经的资本宠儿,或卖身大厂,或黯然离场。
国内也有被聊天机器人“坑的”。
2024 年 3 月,成立不到一年的阶跃星辰首次公开亮相,便以高调姿态切入 C 端市场。当时公司同时推出了两款面向消费者的产品,智能对话助手“跃问”,和角色扮演智能体“冒泡鸭”。其中,跃问被定位为个人效率工具,支持图片上传、文档解析和联网搜索,核心卖点正是阶跃星辰当时引以为傲的多模态能力。
阶跃星辰的思路确实没什么问题。那一年,多模态的确是很能打的差异化标签。
2024 年上半年,国内大部分大模型仍以纯语言能力为主,多模态普遍处于早期阶段。智谱 AI 的 GLM-4V、阿里Qwen-VL 系列虽已推出,但视觉理解深度和复杂场景仍需要改进。月之暗面 Kimi 和 MiniMax 当时的多模态能力相对薄弱,主要依赖后期拼接而非原生训练。
与其他玩家的对比来看,阶跃的 Step-1V在图像理解、多轮视觉指令跟随、图表/文档解析等细分评测中,曾多次位居国内前列,尤其在 OpenCompass 等中文多模态榜单上表现出色,一度被认为是国内多模态理解能力最强的模型之一。
但是技术上的领先并没有转变为商业上的优势。
跃问和冒泡鸭推出后,用户反馈整体平淡。整体来看,阶跃的两款产品虽然具备图片理解等功能,但当时多模态能力还不够成熟,在复杂场景下的表现不够惊艳,用户留存和活跃度因此未能达到预期。冒泡鸭在角色扮演赛道直接面对 MiniMax “星野”等竞品,后者日活跃用户一度维持在约 50 万规模,而冒泡鸭的表现明显落后。
小红书上,曾有自称跃问开发者的博主发帖,向网友征求对产品的问题或意见。但得到的回复大多是吐槽某面试官和其他不相关内容,帖子热度也不高。唯一与跃问的使用体验相关的问题是图文混排问题,博主的回答是公司正在优化该问题,但随后也没有了下文。
但是时间不等人。2024 年下半年,豆包已经杀出,DeepSeek 也即将在半年后震撼整个行业。
这样的环境里,在大厂可以依靠此前建设的用户生态和重金投流的 C 端战场,小厂的生存法则则是打出技术优势并快速转化为极致的产品体验。
但是对于彼时的阶跃星辰而言,这两者都不具备。
补票?预判?
对于产品的遇冷,阶跃星辰还挣扎了一番。
直到 2024 年底,阶跃停止了对“冒泡鸭”的大规模投流,并着手将团队合并。
2025年,公司正式对 C 端业务进行收敛,将“跃问”更名为“阶跃 AI”,并将产品战略从类 ChatGPT 的对话产品转向任务型智能体。
对此,阶跃星辰在接受媒体采访时曾公开回应称:“早期,我们基于当时的模型能力进行了一些产品探索。2025年,随着多模态和推理能力的成熟,我们产品进行收敛,聚焦Agent方向。”
Agent 与多模态有着天然高契合度。
Agent 的核心在于理解环境、规划任务和执行动作。而要真正能够完成真实世界中的复杂任务,AI 必须摆脱对文本信息的依赖。视觉信息,如屏幕界面、图表、文档、物理环境等视觉信号,往往是 AI 处理真实世界任务的信息来源。
随着 2026 年初 OpenClaw 的爆火,Agent 被真正的拉到用户的面前,强大的自动化和处理问题的能力顿时受到了全世界追捧。
那么,阶跃在 2024 年重仓多模态,就显得颇有前瞻性。
多模态的技术积累为后续 Agent 转型提供了技术基础。这种“感知+决策执行”的结合路径,让阶跃在 2026 年具备了较强的差异化优势。
2026 年 1 月,旷视科技联合创始人印奇正式出任董事长,进一步加速了阶跃的 Agent 转型。
印奇负责顶层战略和终端商业化落地,创始人兼CEO 姜大昕继续主抓技术研发。旷视系的计算机视觉基因与阶跃原有的多模态技术实现了良好协同。转型成果在 Step 3.7 Flash 上得到了集中体现。
Step 3.7 Flash 发布于 5 月 29 日,总参数 198B,包括 196B 的语言骨干和 1.8B 的 ViT 视觉编码器。但是 Step 3.7 Flash 每次推理激活参数仅约 11B,最高生成速度超过 400 Tokens/s。
在主流评测平台上,Step 3.7 Flash 展现出较强的实用性能。
根据大模型测评网站 Artificial Analysis Intelligence Index 数据显示,Step 3.7 Flash 整体得分为 43 分,处在国内大模型中上游水平。评分细节上,Step 3.7 Flash 在速度和输入价格上显著占优;在语言冗长问题上是较大的短板;在智能方面,即逻辑能力、代码生成、学习、上下文关联等方面能力虽并不突出,但依然处在第一梯队。
而在对 Agent 能力方面的考核上,Step 3.7 Flash 的表现就显得更专业对口:用于测试Agent执行基准的 ClawEval-1.1 给出的评分是 67.1 分,大幅领先 DeepSeek V4 Flash 的 59.8 分。
阶跃星辰实现这一性能的核心在于稀疏 MoE 架构。MoE 通过路由机制让模型在推理时只激活少量专家子网络。
与传统 Dense 模型相比,MoE 在推理阶段优势显著。根据微软 DeepSpeed-MoE 论文,在提供同等质量输出的情况下,优化后的 MoE 模型推理成本最高可便宜9倍,速度最高可达 4.5 倍或更强。在 Step 3.7 Flash 上,每次推理激活的参数仅约11B,但最高生成速度超过了 400 Tokens/s,达到了接近更大 Dense 模型的实用效果。
够快,够用,也够便宜,Step 3.7 Flash 在生产端 Agent 为阶跃找到了第二条路。
并非“免死金牌”
资本市场上,阶跃也正在迎接密集的追捧。
2026 年初,公司完成超 50 亿元人民币 B+ 轮融资,刷新了中国大模型赛道单笔融资纪录。随后,阶跃开始推进 Pre-IPO 轮融资,累计融资规模近 25 亿美元。
包括腾讯、启明创投、上海国投先导基金、国寿股权及华勤、龙旗、中兴等产业资本纷纷入局,阶跃星辰目前已完成股份制改造并拆除红筹架构,计划于 2026 年 6 月底前向港交所递交上市申请,有望在年底前成为继智谱 AI、MiniMax 之后的中国大模型“第三股”。
资本市场狂热的原因也很简单,有故事、有技术、又有“钱景”。
故事上,Agent 的重要性自不必多言。技术上,作为“多模态最强卷王”,阶跃在手机 UI 理解、图像视频生成、语音交互等领域表现突出,被视为最适合手机、汽车、智能终端等场景的 AI 底座。
钱景上,阶跃被曝出已于吉利、OPPO 等厂商开展合作。阶跃的多模态模型全面接入 OPPO 的智能助理“小布助手”,阶跃联合吉利汽车与千里科技,打造的智能座舱已在吉利银河 M9 上量产搭载。因此,阶跃 2025 年收入达到近 5 亿元,预计 2026 年实现营收 12 亿元。
然而阶跃给自己挣来的,只是第二次与对手搏杀的机会,并不是一张免死金牌。
众所周知,To B 的业务比 To C 难做,尤其是大模型方面。贵自然是一方面,安全、隐私问题是另一方面,还有一个重要的原因是合作企业的流程和节奏。阶跃或许可以每月迭代一款模型,但对于合作伙伴,尤其是他们的技术、合规、产品部门来说,跟上这么快的 OTA 节奏,这几乎是不可能的任务。
并且,阶跃并不能保证未来的合作完全排他。吉利可以接入豆包,OPPO 也可转投他人。就如同此前苹果 AI 手机,最初被传称国内版 AI 服务商是百度,后又被传出苹果在接触千问的消息。
所以,再次回到战场的阶跃依然躲不过技术、用户、资本和声量上的正面冲突。
有意思的是,模型发布一个星期左右,Step 3.7 Flash 在 Hermes 上就出现了“串台”问题。根据网传截图显示,用户可以通过一系列操作,看到其他用户的操作内容。
虽然现在无法确定问题出在 Step 3.7 Flash 或 Hermes 上,还是这是二者在调度、对接上存在的问题。但此类事件一旦发生在极其注重隐私的手机场景,和安全性高于一切的汽车上,对企业来讲都是一场灾难。
但无论如何,阶跃星辰重回战场。它面对的,是更加激烈的角逐。
特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)



