AI 根据声音内容帮照片“对口型”，蚂蚁集团开源 EchoMimic 项目- DoNews

DoNews > 公司新闻 > AI 根据声音内容帮照片“对口型”，蚂蚁集团开源 EchoMimic 项目

AI 根据声音内容帮照片“对口型”，蚂蚁集团开源 EchoMimic 项目

IT之家 2024-07-11 16:48:41

蚂蚁集团 10 日开源了名为 EchoMimic 的新项目，其能够通过人像面部特征和音频来帮人物“对口型”，结合面部标志点和音频内容生成较为稳定、自然的视频。

该项目具备较高的稳定性和自然度，通过融合音频和面部标志点（面部关键特征和结构，通常位于眼、鼻、嘴等位置）的特征，可生成更符合真实面部运动和表情变化的视频。

其支持单独使用音频或面部标志点生成肖像视频，也支持将音频和人像照片相结合做出“对口型”一般的效果。据悉，其支持多语言（包含中文普通话、英语）及多风格，也可应对唱歌等场景。

IT之家附相关链接：

项目地址：https://badtobest.github.io/echomimic.html
Github：https://github.com/BadToBest/EchoMimic

本文转载自IT之家，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请联系IT之家通知我方删除，我方将在收到通知后第一时间删除内容！本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

阿维塔成都车展携手《浪浪山小妖怪》，跨界合作引爆人气！成都车展最火展台！阿维塔携手《浪浪山小妖怪》跨界合作，人气爆棚。联名主题展、小猪妖互动，阿维塔06增程版上市，打造沉浸式体验，传递“奔赴热爱”品牌主张

快手上线外卖入口，新故事要怎么讲？借力美团撬动万亿本地生活市场。

知名汽车博主：汽车行业存在“小订过万”数据造假汽车博主吴佩爆料汽车行业‘小订过万’数据造假，称广告公司策划虚假数据误导消费者与领导，数月后真相终将暴露。

美的集团 2025 上半年营收 2511 亿元，净利润 260 亿元，大涨 25% 美的集团2025年上半年营收2511亿元，净利260亿元，全球布局持续扩展，研发投入达88亿元，位列《财富》世界500强第246位。

李斌内部讲话重申蔚来今年 Q4 盈利目标：必须靠自己的本事蔚来CEO李斌强调四季度必须盈利，坚持纯电技术路线，提升组织效率，全力备战市场胜势。

《张朝阳的物理课》问界专场——新能源电池安全必修课，揭秘热失控背后的物理原理当物理学博士走进超级工厂：一堂关乎安全的新能源电池必修课。

降价求生、销量暴跌，新别克GL8能救上汽通用？别克GL8的生存空间已遭到严重挤压

三生制药发布2025中期业绩，归母净利润13.58亿元，同比增长24.6% 三生制药上半年净利润13.58亿元，增长24.6%，与辉瑞合作PD-1/VEGF双抗项目获15亿美元首付，多款新药进入临床III期或申报阶段。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号