阿里快乐马上线,海外观众还在求开源

万众期待的快乐马(happyhorse)终于上线。

4 月 27 日,阿里宣布 HappyHorse1.0 正式开启灰测。灰测阶段,创作者可在 HappyHorse 官网和阿里云百炼平台注册使用,普通用户可到千问 App 最新版或官方创作平台体验。

字节非常贴心地发布了即梦更新,图标换成了抓马,什么马都抓,甭管你是 horse 还是 pony。

快乐马此前亮相的时候,使用了行业内备受好评的匿名冲榜方案。当它真像一匹脱缰的野马,登顶各大榜单的时候,你很难不疑惑:这是谁的部将?

大家开始其实都不太相信是阿里的,因为阿里没有发布过很牛逼的视频生成模型。而且自己不是内容平台,缺乏抖音和快手的先天优势。

最后新成立的 ATH 事业群出来认领,也算是扬眉吐气了。

快乐马来得很是时候,林俊旸前脚离职引发人才流失和研发前景的焦虑,阿里马上用顶尖模型予以回击,看起来确实有打喷子脸的效果。

当然这两件事本身没有直接联系,模型研发起码也要好几个月,不是三月上马,四月就能下马的。

快乐马出来后,有人去翻负责人张迪的履历,发现张迪开始是阿里星,后来去快手做可灵技术负责人,去年才回流阿里领导淘天旗下的未来生活实验室。

而更早之前负责千问的周畅,被字节挖走后带队做出了 Seedance2.0。甚至现在做可灵的盖坤,当初也是阿里星。

所以这么来说,这两件事好像又有点联系,因为人才的来去没有明显影响到阿里作为技术组织应对变革的能力。

而林俊旸离开引发的关于开闭源的讨论,现在确实有趋势调整的风头。

吴泳铭当时回应,称阿里将继续坚持开源模型策略,这个策略看起来有些避重就轻了。

阿里不会完全转向闭源,但以后开源范围将限制在较小的模型尺寸,大尺寸模型版本将保留给内部卖 MaaS。

最新的 Qwen3.6 系列开源尺寸为 35B 或 27B 参数,Qwen3.6-plus 只能通过阿里平台使用。官网发布页也只提到“将开源更小规模的模型版本,以此重申我们对技术普惠与社区驱动创新的坚定承诺。”

林俊旸离开不是上述调整的原因,但减少了推进的内部阻碍。

他年初曾在某个论坛上表示,自己希望推进 Qwen3-Max 大模型的开源,但未能如愿。

视频生成模型那边,也是类似的过程。阿里通义万相开源到 wan2.2,年初发布 wan2.6 则开始闭源。而且视频模型闭源其实引起了更多争论。

因为你别看当初 Sora 或者 Veo 这些模型闹得很欢,但视频跟文本两个东西可用性上有很大差异。

你现在用大模型写文章或者小说,它的完整度可以做到很高。但你用视频模型即便只生成一段 10s 的视频,抽几十次卡经常都难以达到满意的效果。

所以视频模型出来后,开源社区能做的事情更多。

这一点在 wan 生态上体现得非常明显。

最早的 wan2.1 模型,无论是 T2V 还是 I2V,当时基模能力虽然比其他开源模型强,但也相当粗糙。社区贡献了大量工作来提升使用体验。

比如 lightx2v 这类项目,重构了从采样策略到显存优化的一系列推理流程,降低了延迟和成本,同时提高了稳定性。

又比如各种 LoRA 和轻量化版本,在基础模型之上添加了很多功能。

甚至连美团都跟学术界合作,在 wan2.1 这个基模上面,搞出来 InfiniteTalk 这种解决方案,明显优化了从音频驱动、唇形同步到长视频一致性等方面的能力。

好在当时外卖大战还没开始,不算投敌。

这些社区贡献的东西,都是开源且容易复现的。因此大家都会默认,你后续会从里面吸收东西。

阿里如果一直开源,这显然是个两方各自互惠,推动技术进步的好案例。

但当阿里从开源转向闭源,就免不了有人抱怨你之前是吊开源的凯子,把社区好的工程实践和 idea 拿走就不玩了。

事实上,快乐马最新帖子下面,还有海外观众在呼吁开源。我说实话多少有点看不清形势了。

下面聊聊我具体实测快乐马 vs seedance2.0 vs kling3.0 的情况。

提示词:

第一人称视角(主人视角),镜头中不出现主人身体。两只金毛犬坐在镜头前的地面上,专注地盯着即将被丢出的烧饼。主人将一个烧饼从镜头前方抛出,烧饼在空中形成清晰抛物线。

左边的金毛在烧饼刚被抛出的瞬间立刻起跳,张开嘴试图接住烧饼,但在空中判断失误,没有咬到。烧饼从它嘴边擦过并继续下落。右边的金毛保持冷静,没有起跳,而是在地面等待。烧饼落地后被右边的金毛迅速叼走。两只狗动作自然流畅,反应真实,避免夸张或卡顿。

这个提示词是我从经常刷到的一个短视频博主那里抽取出来的。他有两只金毛,其中一只明显更聪明,每次扔烧饼都是先等另外只傻狗上去接,等接不住掉地下,它提前预判点位抢到手。

下面左上是快乐马、右上是 seedance2.0、左下是 kling3.0、右下是 veo3.1。

生成结果质量排序,我觉得是 seedance2.0 ≈ kling3.0 > 快乐马 > veo3.1。

veo3.1 属于是拉到没法看,烧饼居然是从狗的嘴里凭空冒出来的,完全的 surprise,totally awesome。

seedance2.0 和 kling3.0 结果基本差不多,都比较真实,但都有个小破绽。

seedance2.0 是烧饼落到地上跳得太高,kling3.0 则是烧饼落地后另一只狗楞了几秒才从地上叼起来,而我提示词里说的是“迅速叼走”。

快乐马这边问题更多一些。画面太假,两只狗看起来很像是 cg 的。有穿帮画面,烧饼先掉到狗的鼻子上,结果下一秒就跳到嘴里了。另外也没有呈现烧饼落到地上的画面,呈现不够完整。

所以上面的排序虽然是我觉得,但我觉得还是比较客观的。

提示词:

第一人称视角,画面中不出现主人。真实环境风格,光照自然。一只猫站在桌子上,桌边放着一个装有水的玻璃杯。猫明显有点心虚,一边用前爪轻轻把水杯往桌边推,一边缓慢后退,同时不断抬头看向镜头方向,动作带有试探、犹豫和停顿。水杯在桌面上先是缓慢移动。

推动过程中存在短暂停顿和再次推动的行为。当水杯越过桌边后开始下落,下落速度逐渐加快,符合重力加速度。水杯落地后倾倒或破裂,杯中的水向四周飞溅,水的运动轨迹自然连续,不粘连、不异常变形。猫在水杯掉落后迅速低头看向地面,保持警惕状态。所有运动过程连续自然,无瞬移、无物体消失或重复,符合基本物理规律。

这个提示词大家的表现就非常一致了,全都烂到令我道心破碎。

不是,到底尼玛哪些人在说现实不存在了啊?每次出个新模型都在那刷,现实崩了这么多次大伙还在,平行宇宙理论被实锤了。

这四个模型没有那个呈现出一丁点猫推杯子的动作。

快乐马的视频上来猫猫脚上像沾了胶水,碰到就开始把玻璃杯往外面拉。往外拉的时候,玻璃杯倒扣过来,水居然没往下落,物理学不存在了我只能说。而且杯子落到地上碎渣四溅,但回头看玻璃杯又完好无损。

seedance2.0 视频里则是猫完全没碰杯子,杯子在水平桌面上受到信念感召自动下落。水杯落到地面后,跟小区门口六十岁的大爷一样站得笔直。

kling3.0 也是同样的问题,在猫未接触杯子的情况下,杯子产生自我意识碰瓷我猫哥。另外,画面也没有呈现出杯子落地的效果。

veo3.1 稍微好点,猫脚虽然还是没推杯子,但还是碰了下杯子。杯子倾倒后水没流出来,照样不受重力影响。落地后杯子破碎的效果倒是有,但是玻璃渣子多到完全跟一个杯子不对应。

上面这几个视频不一定客观反映模型的能力差异,有可能我的测试数据太少,毕竟 AI 视频生成经常需要大量抽卡。

但仅从这些有限的初步测试看,快乐马的模型跟其他家有没有特别明显的差距。

不过目前价格上阿里给了很大折扣,专业会员包月后可以做到最低 0.44 元/秒,性价比还是拉满的。

当然,这些评价的前提就是快乐马不开源,快乐马只要立马开源,我将立马带头冲锋,将其奉为真神。

特别声明:本文为合作媒体授权 DoNews 专栏转载,文章版权归原作者及原出处所有。文章系作者个人观点,不代表 DoNews 专栏的立场,转载请联系原作者及原出处获取授权。(有任何疑问都请联系idonews@donews.com)

标签: seedance
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1