据知情人士透露,阿里巴巴将于今晚全面开源其旗下视频生成模型——通义万相2.1。该模型在今年1月进行了升级,显著提升了视频和图像生成能力。通过自研的高效VAE和DiT架构,通义万相2.1增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,并首次实现了中文文字视频生成功能,登上VBench榜单首位。
此外,通义万相2.1不仅支持中英文视频的一键生成艺术字,还提供了多种特效选项,如过渡、粒子效果和模拟等,以增强视觉表现力。该模型还能模拟复杂运镜,还原物理规律,例如雨滴落在伞上会溅起水花,为用户带来更逼真的视频体验。