天眼查App显示,2025年6月20日,「语音流处理方法、深度学习模型的训练方法、装置及智能体」正式进入专利公布阶段。申请人为北京百度网讯科技有限公司,该项人工智能专利涉及语音处理与语音转换技术领域。据专利信息显示,该技术能够显著优化语音流处理效率和准确性。发明人为李思磐、孙涛、贾磊。
本公开提供了一种语音流处理方法,包括对待处理语音流中的第一语音帧序列进行特征提取,得到第一语音特征;基于注意力机制融合第一语音特征和基于第二语音帧序列确定的第二语音特征,得到语音融合特征;以及基于预设语音属性对语音融合特征进行转换,得到与第一语音帧序列对应的转换语音数据。此技术在提升语音处理性能方面取得突破性进展,为人工智能技术的发展提供了重要支持。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。