天眼查App显示,2025年5月6日,「一种基于阈值自适应的语音活动检测方法及装置」正式进入专利公布阶段。申请人为厦门亿联网络技术股份有限公司,该项语音识别领域专利涉及复杂环境下的语音活动检测技术。据专利信息显示,该技术实现了更迅速的噪声跟踪,并显著优化了语音活动检测的准确度。发明人为邱志豪。
专利摘要指出,本发明能够实时更新判断阈值,在复杂的环境中快速且准确地检测出语音和噪声。具体而言,该方法对阵列麦克风拾取的原始多通道信号进行波束形成处理,获取语音波束和噪声波束;根据语音波束和噪声波束分别计算各时刻的长时能量差和短时能量差;通过第一阈值进行第一语音活动检测,若结果为待检测信号,则在各扫描窗进行第二语音活动检测,包括峰值更新、峰值衰减值更新、阈值更新和语音活动判断。此项技术突破性进展将广泛应用于语音识别、噪声抑制等领域。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。