今日,阿里开源了多模态视频生成模型通义万相Wan2.2-S2V。该模型通过输入一张静态图片和一段音频,可生成面部表情自然、口型一致的电影级数字人视频,单次生成视频时长可达分钟级,显著提升视频生成质量与实用性。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
今日,阿里开源了多模态视频生成模型通义万相Wan2.2-S2V。该模型通过输入一张静态图片和一段音频,可生成面部表情自然、口型一致的电影级数字人视频,单次生成视频时长可达分钟级,显著提升视频生成质量与实用性。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。