视频模型:最容易制造惊艳,也最容易消耗惊艳

4月以来,视频模型重新成为AI行业里最拥挤的赛道之一。

先是月初,阿里的HappyHorse-1.0登顶Artificial Analysis视频竞技场榜单,在无音频文生视频榜单中拿到1368的Elo分,力压Seedance 2.0和可灵3.0。

随后,总部位于美国的fal.AI上线HappyHorse-1.0官方API。fal主要为开发者和企业提供图像、视频、语音等生成模型的API调用和推理服务,此前已接入可灵、海螺等视频模型。

同一时间,视频模型创业公司开始密集释放资本信号。生数科技和爱诗科技在斩获两笔融资后,先后传出考虑赴港上市的消息。

而随着阿里正式入场,巨头厂商间的竞争格局愈发激烈。

快手的可灵,是业内最早跑出规模商业化的样本,可灵2025年12月单月收入超过2000万美元;另一边,字节年初凭借Seedance 2.0的惊艳表现不断做大声量。

国产视频模型风生水起的几个月中,OpenAI则选择了在本月关停旗下视频模型产品 Sora,宣告了视频模型的上一个周期结束,也迎来了国产视频模型的加速周期,相关统计显示,今年以来,中国AI视频赛道已经发布约10个模型。

只是,Sora退场也更像一个提醒:视频模型最容易制造惊艳,也最容易消耗惊艳。蜂拥而至的国产厂商们,都将面临一个共性问题:技术层面的差距在毫厘之间,而商业化层面的竞争已经进入深水区。

01

巨头三强:有人抢声量,有人冲榜单

参考Artificial Analysis榜单,国产视频模型的头部由三大巨头组成:快手可灵、字节Seedance以及阿里HappyHorse。不过,在榜单上的你追我赶背后,三家公司面对的是完全不同的考题。

可灵的关键词是商业化,在技术指标的打榜之外,可灵最早拿出了相对清晰的收入账单。公开报道显示,可灵在2025年12月单月收入超过2000万美元,相比2025年3月披露的1亿美元年化收入有明显增长。

快手方面在此前的财报电话会中透露,截至2026年1月,可灵AI年化收入运行率(ARR)已超过3亿美元,并透露出今年将实现收入同比翻倍以上增长的信心。

在国产视频模型已公开的营收数据中,这一数据处于绝对领跑的地位。同期,可灵服务超过6000万创作者,累计生成超过6亿条视频,并与超过3万家企业用户建立合作。

可灵在模型侧发力得很早,自2024年6月开放后,它一直是国产视频模型追赶Sora的代表。但进入2026年后,两大竞争对手先后在视频基模领域给可灵“上强度”。

Artificial Analysis最新榜单显示,在无音频文生视频榜单中,Kling 3.0 1080p Pro排在第三,前面是阿里和字节的HappyHorse 1.0和Seedance 2.0。

值得注意的是,主导HappyHorse的核心人物张迪,此前正是可灵的技术负责人。

不过,只看榜单跑分,Seedance 2.0、HappyHorse和可灵3.0的差距并不大,真正的差距体现在,阿里和字节不约而同地下场开始争抢用户声量。

Seedance 2.0的关键词就是“出圈”。

该模型发布后不久,一段由爱尔兰导演Ruairi Robinson用Seedance 2.0生成的“汤姆·克鲁斯与布拉德·皮特”视频在社交平台传播,其中一条播放量超过140万,另一条超过300万。

甚至马斯克都曾在X上评论Seedance 2.0视频:“这一切发生得太快了。”

Seedance 2.0在国内的出圈,也被“雪山救狐狸”带起。这条由贵州一家酱板鸭品牌四人团队制作的AI短片,耗时约5小时、花费40元,全网传播量突破50亿。

相关报道显示,主创先用豆包拆脚本,再用小云雀和即梦生成画面,即梦的Seedance系列就是主要模型之一。

与此同时,字节也在主动推动Seedance 2.0的行业心智:贾樟柯担任监制的春节贺岁短片《贾科长Dance》由Seedance 2.0生成,火山引擎总裁谭待还透露,Seedance 2.0在正式推出前已参与央视春晚多个节目的视觉制作,春晚是它的第一个客户。

显然,视频领域的优势不只是模型本身。字节在视频生产链路上拥有其他公司很难复制的入口:即梦面向创作者,剪映承接剪辑需求,还有抖音这样的巨量内容池,企业侧由火山引擎承接企业调用。

所以,一旦Seedance开始收割用户声量,依托字节的资源可能比可灵更快收割C端创作者心智。

不过,用户声量的扩张,并不完全能代表商业层面的胜利。一方面,字节目前没有披露类似可灵那样清晰的ARR口径。在专业级用户的市场中,究竟与可灵的市场份额占比如何,仍是未知。

其次,Seedance 2.0的出圈,直接在正面撞上版权和肖像问题。美国电影协会、演员工会等好莱坞组织批评Seedance 2.0涉嫌大规模未经授权使用版权作品和演员肖像,随后,字节方面因好莱坞版权争议暂停了Seedance 2.0的全球发布。

而当Seedance还在和版权问题作斗争的时候,阿里带着HappyHorse抢走了它榜单第一的位置。

事实上,HappyHorse-1.0是在无音频文生视频榜单中排第一,Elo分达到1368;而在图生视频有音频榜单中,Seedance 2.0 720p仍然排第一,HappyHorse-1.0排第二。

这个原本属于淘天旗下的多模态团队,迅速成为了阿里在多模态领域的金字招牌。

不过,HappyHorse目前证明的是理论上的技术冲击力,而两大竞争对手可灵和Seedance/即梦,都已经形成了真实用户体量的护城河。

事实上,Artificial Analysis的榜单会每日动态更新,盲测偏好一定程度上能反映输出质量,但不能替代具体业务场景里的成本、速度、稳定性和合规测试。

腾讯云开发者社区中,有行业人士横评了这三大模型:HappyHorse-1.0在多镜头测试里,它在11个视觉锚点中保持了9个,人物连续性强于Seedance 2.0;音画同步测试里,声画延迟控制在80毫秒内,优于可灵3.0的120毫秒。

然而,是物理拟真和复杂规律成为了HappyHorse的短板。水杯碎裂测试要求模型在5秒内模拟碰撞、流体、玻璃裂纹等6种物理现象,HappyHorse出现网球未接触杯体、杯子已反向倾倒,水体穿模、裂纹扩散生硬等问题。

价格比对中,它的720P折后价约0.44元/秒,低于Seedance 2.0的1元/秒和可灵3.0的0.48—0.96元/秒。

再往后看,阿里与快手、字节的差异也很明显。快手有短视频社区,字节有全球化视频工具和分发平台,而阿里没有天然的内容社区。

HappyHorse更可能进入的是阿里云百炼、千问、电商营销、商家素材、品牌广告和企业内容生产,短时间内还不会和即梦、可灵正面厮杀。

而在一线AI大厂中,百度和腾讯今年以来都没有更新视频模型品类。两家公司最近一次较明确的视频模型版本发布,仍停留在去年10月至11月。

显然,在视频模型第一梯队中,至少在整个2026上半年,都将是阿里、字节、快手的三强格局。

02

第二梯队:上市、融资和路线分化

巨头之外,第二梯队正在分化,首先来关注瞄准了IPO的两家创业公司,生数科技和爱诗科技。

4月,生数科技完成20亿元人民币B轮融资,由阿里云领投。

产品上,Vidu仍是生数最重要的抓手。Vidu Q2曾重点推出Reference-to-Video能力,允许用户上传最多7张参考图,用人物、物体、场景或道具作为约束,生成更一致的视频。

生数另一张牌是“世界模型”。它的路线更接近视频基座世界模型——通过海量视频学习时间、空间、运动与因果规律,再延展到机器人动作模型,而不是纯3D空间重建路线。

另一边,爱诗科技PixVerse是一家面向全球创作者的视频生成平台,目前也传出考虑最快今年赴港上市,并已与中金、摩根大通等投行合作。最新融资信息显示,爱诗今年完成3亿美元C轮融资,估值超过10亿美元。

营收方面,爱诗科技ARR约4000万美元,生数科技公开可查口径约2000万美元,距离支撑十亿至二十亿美元级估值,仍需要更强的收入增长、成本控制和企业级复购证明。

如果进一步比较,爱诗更像是“C端规模先跑出来”的公司,靠PixVerse和拍我AI获得用户与订阅收入;生数更像是“技术与模型叙事更强”的公司,背靠清华团队、U-ViT架构和Vidu的行业能力。

但两者共同的问题是,AI视频生成尚未进入稳定盈利期,巨头竞争、算力成本、版权合规和用户留存,都可能成为IPO审核和二级市场定价时的核心阻碍。

两家创业公司之外,另一家值得关注的视频模型厂商,是曾经“六小龙”中的代表人物MiniMax。

MiniMax旗下的海螺曾经是上一轮国产视频模型热潮里的代表产品,而MiniMax也是六小龙中少数坚持视频模型产品线代表。

但到了2026年,海螺的行业存在感明显不如去年。海螺的上一次模型更新,还是发布于2025年10月的Hailuo 2.3和2.3 Fast,主要提升身体动作、面部表情、物理真实感和提示词遵循。

走全球化路线的海螺,同样面临着版权问题。此前有报道称,迪士尼、环球、华纳兄弟探索在美国起诉MiniMax,指控其Hailuo AI使用被盗知识产权,并能生成《星球大战》达斯·维达、小黄人、神奇女侠等版权角色。

另一匹“黑马”来自昆仑万维。3月发布的SkyReels V4冲进Artificial Analysis无音频文生视频榜单前列,一度排到第四。昆仑万维方面此前披露,SkyReels V4目前已全面开放API。

但它的差异在于,昆仑本身有短剧和海外内容业务,SkyReels仍是优先进入自家短剧、广告、游戏等生产链路,承担降本工具角色。这是这部分内部效率,能否折算成有效的商业化收入仍是未知。

第二梯队的共同处境正在变得清楚:每家公司都有出口,但每个出口都不宽。

视频模型领域和AI Coding不同,缺少平台优势的厂商,只讲基座模型的故事是不够的。生数拥抱世界模型概念,爱诗讲全球化创作工具,MiniMax专注于在Agentic模型上赚钱,而昆仑万维优先赋能自家的短剧业务。

显然,对于创业/腰部公司而言,视频模型的问题不只在于技术领先程度,更在于ROI的困境。

03

Sora退场后,视频模型的ROI困境

Sora退场,是今年视频模型行业最重要的警示。

OpenAI方面在几天前,正式关停了Sora,而Sora API将于9月24日停止服务。

这一举措十分突然,有报道披露,OpenAI的动作让迪士尼等合作方感到意外,也意味着双方一项拟议中的10亿美元合作告吹;报道还提到,OpenAI正把重点转向更有盈利潜力的编码工具和企业解决方案。

这件事直接揭露的当下的视频模型困境,技术突飞猛进,但是商业化难题一直在台面上。

首先面临的第一道坎就是成本。

视频生成不是“一句提示词换一段成片”。它背后是多帧生成、时序一致性、高分辨率、音画同步、失败重试和后期筛选。用户最后看到的是一条8秒、10秒、15秒的片段,平台承担的是大量候选结果和算力消耗。

AI应用开发平台MindStudio,在一篇行业博客中把Sora的失败归结为“推理墙”:文章称,Sora关闭前每天推理成本约1500万美元,而生命周期收入约210万美元。

这对国产模型同样成立,尽管国内市场的版权压力相对较小,但定价和营收始终是一门玄学。

以Seedance为例,Sora退场后,Seedance 2.0一度被视为中国视频模型市场最强的挑战者,但字节随后在一个月内多次上调即梦价格:高级版年费从2599元涨到3099元,不同套餐的月度额度被削减三分之一到一半以上。

这意味着,一段2分钟AI漫剧的素材生成成本,从7元涨到约80元。

涨价背后是算力账。文章称,一个15秒视频大约消耗30万token;按照火山引擎3月公布的Seedance API价格,视频输入模式为每百万token 28元,无视频输入模式为每百万token 46元,折算下来,一段15秒视频约15元,约合1元/秒。

巨额的算力消耗背后,是模型厂商难以平衡营收和服务质量的现状。

有针对即梦的相关分析显示,即使是高级会员用户,排队时间仍然超过3小时。普通用户有时需要排在8万人后面等待。只有签订合作协议的大型制作公司才能使用Seedance的完整功能,无需排队。

根据界面等媒体报道,想要使用Seedance 2.0的逼真人类视频模式,则需要单独签订企业协议,且最低消费额为500万元人民币。

另一方面,版权问题仍是视频模型领域的拦路虎,甚至不止在好莱坞,国内市场也是如此。

几天前,爱奇艺在世界大会上称,已有100多名深度合作艺人同意入驻纳逗Pro艺人库,引发舆论争议;随后于和伟、张若昀、王楚然等多位艺人或团队否认签署AI相关授权文件。

爱奇艺回应称,入驻艺人库只代表有接洽AI影视项目的意愿,是否参加具体项目、出演具体角色,仍需单独商谈和授权。

这件事更能说明视频模型商业化的麻烦:不是平台给了授权,问题就解决了。

证券时报在后续报道提到,爱奇艺、Seedance和即梦等平台都在探索明星人脸授权模式,但有法律界人士表示了担忧,平台服务协议和创作者协议叠加后,可能让艺人难以控制自己的AI形象后续被用到哪里。

人脸既是商业素材,也是生物识别信息;一旦进入短剧、广告、互动视频和虚拟直播,授权边界、使用次数、二次创作、收益分配和撤回机制都会变成新问题。

这些问题总结下来,还是回归到老生常谈的ROI问题。

麦肯锡在2026年关于影视制作和AI的报告中提到,AI可能改变内容生产方式和行业价值链,但它带来的结果不只是一种:可能压低成本、扩大内容供给,也可能重塑价值分配。

德勤在2026年TMT预测中也提醒,AI的承诺和现实价值之间仍存在差距,真正的规模化来自推理计算、智能体编排和运营收益等后台能力的持续改善。

这句话放到视频模型上尤其现实。尤其在Sora退场之后,视频模型行业的标准变了。

最会做演示的模型,不一定活得最好;最会冲榜的模型,也不一定最能赚钱。

真正能穿越周期的公司,必须把生成能力接进生产链路,压低真实交付成本,处理版权合规,并让客户算清ROI。

视频模型当然还会继续进步。它的上限仍然很高,尤其是在广告、电商、短剧、游戏、影视预演和社交内容生产里。但2026年的问题已经不再是“谁能生成一段更像电影的视频”,而是“如何给客户提供能持续产生营收的服务”。

经历了轰轰烈烈的跑分竞赛之后,视频模型正在跑进深水区。

特别声明:本文为合作媒体授权DoNews专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表DoNews专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)

标签: 视频模型 AI
Copyright © DoNews 2000-2026 All Rights Reserved
京ICP备2025120072号