天眼查App显示,2025年6月13日,「一种语音生成方法及装置」正式进入专利公布阶段。申请人为北京达佳互联信息技术有限公司,该项声学专利涉及跨语种场景下的语音生成技术。据专利信息显示,该技术可以显著优化音色迁移失真的问题。发明人为强春雨、张晨。
本申请实施例公开了一种语音生成方法及装置。其中该方法包括:获取目标语言文本以及目标说话人的源语言提示语音;从预设的目标语言数据库中,匹配出与源语言提示语音的音色对应的目标语言提示语音;至少对目标语言文本以及目标语言提示语音对应的目标语言提示文本进行编码,得到音素特征表示,以及至少对目标语言提示语音进行编码,得到提示风格特征表示;利用音素特征表示和提示风格特征表示,生成目标语言文本对应的目标语言语音。通过该方法,可以在跨语种场景中生成与源语言提示语音的音色对应的目标语言语音,从而有效降低音色迁移失真的问题。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



