天眼查App显示,2025年6月13日,「语音交互方法、装置、智能终端及可读存储介质」正式进入专利的公布阶段。申请人为深圳市卓越智运科技有限公司,该项智能语音技术专利涉及多模态信息采集与情感状态识别的应用场景。据专利信息显示,该方案实现了数字人交互能力的显著优化。发明人为李涛。
本申请公开了一种语音交互方法、装置、智能终端及可读存储介质,所述语音交互方法包括:响应用户的语音触发操作,采集用户的多模态信息;获取多模态信息中语音数据对应的语音特征和人脸数据对应的人脸特征;基于语音特征的语音情感以及人脸特征对应的人脸表情,识别用户对应的情感状态;基于情感状态对应的协议解析消息,生成数字人对应的互动信息,并根据互动信息控制数字人与用户进行动态交互。本申请提供的语音交互方案可以解决数字人在复杂情感变化下的动作触发不够灵活的问题,从而提高交互能力。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。