快手旗下可灵 AI 近日推出数字人功能,用户上传一张角色图片并提供文字或音频输入,即可生成分辨率为1080p、帧率为48FPS、最长持续1分钟的数字人视频。该功能目前正处于公测阶段,正逐步向用户开放。
该数字人功能依托多模态理解与视频生成模型的深度结合,实现口型精准同步及情绪动作的精细控制。系统采用基于 Transformer 的 DiT 架构,在处理时序信息和细粒度控制方面具备优势,能够准确解析面部特征、理解音频语义,并根据语音内容推断合适的面部表情与微动作,确保生成视频中角色的一致性。
在角色支持方面,可灵 AI 数字人可生成真人、动画角色及动物形象;语言方面支持中文、英文、日文、韩文等多种语种,满足多样化需求。结合会员优惠,其使用成本最低可达0.12元/秒。
用户可通过可灵 AI 官网体验该功能。未来随着技术迭代及API开放,可灵 AI 数字人有望接入更多第三方平台与应用,构建更完善的生态系统。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。