人工智能技术的进步,对语音合成(TTS)的自然性和表现力的需求越来越高。上个月,微软发布了三种专为对话场景设计的新型逼真的人工智能语音。近日,微软又为美国东部 / 东南亚 / 西欧地区等更多区域发布了 7 种新的逼真的人工智能语音,涵盖了法语(加拿大)、法语(法国)、德语(德国)、意大利语(意大利)、韩语(韩国)、葡萄牙语(巴西)、西班牙语(西班牙)等语言。
这些新的语音非常适合需要生动的语音交互的应用,包括聊天机器人、语音助手、游戏、在线学习、旅游景点等。
除了这 7 种新的语音,微软还对现有的 3 种语音进行了更新,增加了更多的表现力。
微软是如何创建这些逼真的人工智能语音的呢?微软称,“我们首先为每种语音设计了一个人格,就像一个真实的人一样,友好而乐观,总是乐于帮助别人,分享有趣或实用的知识。这种语音的说话风格类似于与熟人喝茶时的对话,保持自然而不夸张的语气。”
目前,微软提供了超过 400 种神经网络语音,覆盖了 140 多种语言和地区,IT之家小伙伴在这里试听这些新的语音。
本文转载自IT之家,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系IT之家通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。