广电运通集团股份有限公司语音识别方法、语音识别装置和语音识别系统专利公布(语音技术专利快讯)

天眼查App显示,2025年6月3日,「语音识别方法、语音识别装置和语音识别系统」正式进入专利的公布阶段。申请人为广电运通集团股份有限公司,该项语音技术专利涉及多模态端点信号和语音活动检测模型在音频流数据处理中的应用,可显著优化输出识别文本的延迟,并减少硬件资源占用,适用于实时交互场景以及识别精度需求较高的场景。据专利信息显示,该技术实现了突破性进展。发明人为杨礼鑫、宋卫、田丰、卫晓欣、胡祺航、庄纯仪。本申请公开了一种语音识别方法,包括获取音频流数据,在获取过程中获取多模态端点信号,基于多模态端点信号和语音活动检测模型对音频流数据进行分割,得到至少一个音频段;基于离线语音识别模型对至少一个音频段进行流式语音识别,得到识别文本,并流式输出识别文本。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1