中电信数智科技有限公司一种视频会议场景下实时语音识别系统专利公布(音频处理专利快讯)

天眼查App显示,2025年6月20日,「一种视频会议场景下实时语音识别系统、方法、存储介质及设备」正式进入专利的公布阶段。申请人为中电信数智科技有限公司,该项音频处理专利涉及视频会议中的实时语音识别技术。据专利信息显示,该技术能够显著优化语音识别效果,并有效降低语音识别模块的负载。发明人为王量。

本发明公开了一种视频会议场景下实时语音识别系统、方法、存储介质及设备,包括:RTP对时模块用于同步服务端和各客户端的时间戳,并将时间戳的基准信息传入音频处理模块;音频处理模块用于对客户端的音频进行编码,将编码的音频以及客户端的麦克风状态发送给智能调度模块;智能调度模块通过智能调度算法将编码的音频创建到对应的语音识别实例中,并将编码的音频传送到语音识别模块;语音识别模块用于音频的语音识别,将识别的信息发送给结果处理模块;结果处理模块将识别的信息转发给实施撰写内容展示模块进行展示。本发明通过智能调度复用语音识别实例,减小语音识别模块的负载,能够兼顾视频会议中的各种发言场景,保证语音识别效果。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1