百度发布自研视频生成模型MuseSteamer，服务广告主需求- DoNews

在百度AI DAY科技开放日上，百度移动生态商业研发团队正式发布自研视频生成模型MuseSteamer及视频产品平台“绘想”。该模型采用DIT架构，参数与业界最大视频生成模型处于同一量级，支持连续10秒动态视频生成，最高分辨率达1080P。

MuseSteamer并非来自研发文心大模型的技术中台部门TPG。去年10月，百度CEO李彦宏曾在内部讲话中称百度不会做视频生成模型，因Sora类模型投入周期过长。

百度副总裁、移动生态商业体系负责人陈一凡在媒体沟通会上表示，为帮助代理商和广告主快速生成广告，百度推出擎舵平台。有反馈称部分科幻场景难拍摄，需借助大模型生成，由此推动自研视频生成模型立项。

一位百度内部人士透露，李彦宏曾提出可基于多模态需求开发特定视频生成场景。此前发布的罗永浩数字人及此次MuseSteamer均基于特定需求研发，属百度内部探索方向。

目前市场主流视频生成模型多为技术驱动型，持续优化算法、算力、数据以提升性能，但缺乏明确应用场景。相比之下，MuseSteamer属商业驱动型，先有明确商业需求再结合研发模型。

百度商业体系商业研发总经理刘林透露，MuseSteamer项目于今年春节后立项，研发团队几十人，有效研发时间仅3个月。该项目快速上线得益于擎舵平台在多模态生成方面的技术积累，以及百度商业体系在模型训练框架推理、卡片调优等方面的既有基础。

MuseSteamer模型Turbo版已上线“绘想”平台，开启限时免费公测，其余版本将于8月陆续开放。陈一凡表示，“绘想”平台定位为营销产品，目标服务B端广告主。

根据百度官方公布数据，“绘想”平台已生成超过100个AIGC广告并在百度商业体系内上线投放。

对于是否服务C端用户，陈一凡未给出明确答案。不过，全新改版的百度搜索已接入MuseSteamer模型，后续或将其接入更多C端产品面向普通用户提供服务。

“C端的想象空间是非常大的，前提是我们把模型做好。”陈一凡表示。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。