谷歌推出 AI 视频对口型技术:根据翻译语言改变人物说话方式,但不开放使用

在 2023 I / O 开发者大会上,谷歌宣布正在开发一项名为 Universal Translator 的实验技术。

顾名思义,该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该技术不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情,人物说话视频会根据目标语言的发音同步改变口型。

如上图所示,Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的口型。

考虑到此工具可能被滥用来创建虚假视频,谷歌表示将限制对 Universal Translator 的访问。因此,只有谷歌授权合作伙伴才能将其用于建设性项目,而普通用户无法使用

本文转载自IT之家。本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1