在百度AI DAY科技开放日上,百度移动生态商业研发团队正式发布自研视频生成模型MuseSteamer及视频产品平台“绘想”。该模型采用DIT架构,参数与业界最大视频生成模型处于同一量级,支持连续10秒动态视频生成,最高分辨率达1080P。
MuseSteamer并非来自研发文心大模型的技术中台部门TPG。去年10月,百度CEO李彦宏曾在内部讲话中称百度不会做视频生成模型,因Sora类模型投入周期过长。
百度副总裁、移动生态商业体系负责人陈一凡在媒体沟通会上表示,为帮助代理商和广告主快速生成广告,百度推出擎舵平台。有反馈称部分科幻场景难拍摄,需借助大模型生成,由此推动自研视频生成模型立项。
一位百度内部人士透露,李彦宏曾提出可基于多模态需求开发特定视频生成场景。此前发布的罗永浩数字人及此次MuseSteamer均基于特定需求研发,属百度内部探索方向。
目前市场主流视频生成模型多为技术驱动型,持续优化算法、算力、数据以提升性能,但缺乏明确应用场景。相比之下,MuseSteamer属商业驱动型,先有明确商业需求再结合研发模型。
百度商业体系商业研发总经理刘林透露,MuseSteamer项目于今年春节后立项,研发团队几十人,有效研发时间仅3个月。该项目快速上线得益于擎舵平台在多模态生成方面的技术积累,以及百度商业体系在模型训练框架推理、卡片调优等方面的既有基础。
MuseSteamer模型Turbo版已上线“绘想”平台,开启限时免费公测,其余版本将于8月陆续开放。陈一凡表示,“绘想”平台定位为营销产品,目标服务B端广告主。
根据百度官方公布数据,“绘想”平台已生成超过100个AIGC广告并在百度商业体系内上线投放。
对于是否服务C端用户,陈一凡未给出明确答案。不过,全新改版的百度搜索已接入MuseSteamer模型,后续或将其接入更多C端产品面向普通用户提供服务。
“C端的想象空间是非常大的,前提是我们把模型做好。”陈一凡表示。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。