上海师范大学等模型训练及语音识别方法、装置、设备及介质专利公布(人工智能专利快讯)

天眼查App显示,2025年8月12日,「模型训练及语音识别方法、装置、设备及介质」专利正式进入专利的公布阶段。申请人为上海师范大学,云知声智能科技股份有限公司,该项人工智能专利涉及语音识别技术领域。据专利信息显示,该技术采用基于噪声解构的语音识别模型训练策略,通过阶段式训练方式提升模型训练效率与噪声鲁棒性,显著优化了语音识别效果。发明人为龙艳花;陈双圆;许东星。本申请公开了一种基于噪声解构的语音识别模型的训练方法及语音识别方法、装置、设备及介质。采用先隔离训练噪声解缠模块,再微调训练Conformer-Transducer架构的阶段式训练策略,避免了同时训练多个复杂模块带来的高计算复杂度和训练难度。在隔离训练阶段,可以快速优化噪声解缠模块的性能;在微调训练阶段,利用已训练好的噪声解缠模块,集中精力优化Conformer-Transducer架构,提高训练效率,减少训练时间和计算资源的消耗。在隔离训练和微调训练过程中,对部分模块的参数进行冻结,减少了需要优化的参数数量,从而降低了计算复杂度。通过噪声解缠模块将语音信号中的噪声和纯净语音进行解构,再结合Conformer-Transducer架构进行准确的语义理解,使整个语音识别模型对噪声具有更强的鲁棒性。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1