科大讯飞股份有限公司语音唤醒方法、装置等专利公布(声学信号处理专利快讯)

天眼查App显示,2025年6月10日,「语音唤醒方法、装置、电子设备、存储介质和程序产品」正式进入专利公布阶段。申请人为科大讯飞股份有限公司,该项声学信号处理专利涉及低功耗设备的语音唤醒技术。据专利信息显示,该技术通过优化声学模型中的分类层,显著降低模型输出状态数及资源需求,确保语音唤醒方法可以应用于低功耗设备。发明人为江坤、王磊磊、戴亮、卢晶晶。 「本发明提供一种语音唤醒方法、装置、电子设备、存储介质和程序产品,涉及声学信号处理技术领域。该方法包括:将音频数据中各音频数据帧输入至声学模型,得到声学模型输出的音素级状态序列;基于音素级状态序列,确定是否为语音唤醒状态。本发明中的声学模型是基于第一样本音频数据帧及其对应的混合音素状态标签,对已训练模型中的分类层进行优化得到的,且混合音素状态标签包括唤醒状态对应的三音素状态,以及非唤醒状态对应的单音素状态,从而只需对应音素为唤醒状态才需要标注三音素状态,否则只需标注状态数更少的单音素状态,从而降低声学模型输出的状态数,进而降低声学模型所需的资源要求,确保语音唤醒方法可以应用于低功耗设备。」

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1