天眼查App显示,2025年6月17日,「一种低延迟语音合成方法、装置、设备和介质」正式进入专利公布阶段。申请人为北京宇信科技集团股份有限公司,该项语音处理专利涉及语音合成技术领域,旨在降低语音合成的延迟时间,同时提高语音的自然度和表现力。据专利信息显示,该技术实现了显著优化。发明人为王若曦、周继敏。本发明公开了一种低延迟语音合成方法、装置、介质和设备,属于语音处理技术领域,所述方法包括:S10:对输入文本进行规范化处理,得到规范化文本;S20:对所述规范化文本进行分词处理、词性标注处理和韵律信息分析,得到语言结构化文本;S30:利用深度学习算法对所述语言结构化文本进行特征提取,得到文本特征向量;S40:使用基于变换器的非自回归的语音合成模型,将所述文本特征向量转换为语音信号。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



