北京百度网讯科技有限公司语音识别方法、模型训练方法、装置、电子设备以及介质专利完成公布(人工智能专利快讯)

天眼查App显示,2026-01-13,「语音识别方法、模型训练方法、装置、电子设备以及介质」正式进入公布阶段。申请人为北京百度网讯科技有限公司,该项人工智能专利涉及大模型、语音识别与自然语言处理技术场景。据专利信息显示,该方法通过将音频特征、目标文本特征及语义特征进行语义融合,显著优化语音识别过程中的上下文理解与修正能力。发明人为张建涛;邵俊尧;张策;贾磊。本公开提供了一种语音识别方法、模型训练方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及大模型、语音识别和自然语言处理领域。具体实现方案为:将待处理音频的音频特征、目标文本的文本特征和待处理音频的语义特征进行语义融合,得到目标融合特征;其中,目标文本与待处理音频之间存在语义关联;目标融合特征融合了待处理音频的声音信息和语义信息,以及目标文本的上下文信息;语义特征是对音频特征进行解码得到的;对目标融合特征进行解码,生成修正文本;其中,修正文本包括用于标识修正位置的位置标识和修正字段;以及按照位置标识,利用修正字段对初始文本进行修正,得到目标识别文本;其中,初始文本是对语义特征进行解码得到的。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1