作业帮教育科技（北京）有限公司一种基于多模态语音识别模型预测语音内容的方法及装置专利公布（语音技术专利快讯）- DoNews

DoNews > 公司新闻 > 作业帮教育科技（北京）有限公司一种基于多模态语音识别模型预测语音内容的方法及装置专利公布（语音技术专利快讯）

作业帮教育科技（北京）有限公司一种基于多模态语音识别模型预测语音内容的方法及装置专利公布（语音技术专利快讯）

2025-06-06 16:34:02

天眼查App显示，2025年6月6日，「一种基于多模态语音识别模型预测语音内容的方法及装置」正式进入专利公布阶段。申请人为作业帮教育科技（北京）有限公司，该项语音技术专利涉及多模态语音识别模型的构建与训练，旨在解决固定语言模型参数不能很好适配实际场景需求的技术问题。据专利信息显示，该发明在模型适配性方面实现显著优化。发明人为郑思远、付凯奇、杨帆和周舒然。

专利摘要指出，本发明公开了一种基于多模态语音识别模型预测语音内容的方法及装置，多模态语音识别模型包括语音转文本大模型、模态适应层、Embedding层和大语言模型。其训练流程分为两个阶段：第一阶段使用自动语音识别数据训练多模态语音识别模型，其中大语言模型和Embedding层的模型参数保持固定；第二阶段在第一阶段完成后，固定语音转文本大模型的参数，对大语言模型采用优化微调策略。通过这种方法，有效提升了模型在实际应用场景中的适配能力。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

魏建军“语出惊人”，长城汽车难掩颓势在新能源汽车市场上，长城汽车严重落后。

特斯拉人形机器人Optimus项目负责人将离职；比亚迪股份获南向资金净买入25.95亿港元；“海舶无人船”完成数千万元A轮融资｜Do早报今日早报已为你呈上～

选人选歌、节目的公正度，关于《歌手2025》的热度与争议，我们问了问总监制洪啸 “继续无畏的真。”

快手14周年，程一笑再次强调“用户第一” 与“AI投入” 快手的初心始终未变

传蔚来要给英国迈凯伦超跑造电池了蔚来将为迈凯伦供应4680大圆柱电池，助力其混动车型电动化，同时深化与Forseven合作，重启120度电池包研发。

华为两款鸿蒙电脑今起开售，最低 7999 元起华为发布两款鸿蒙电脑，MateBook Pro售价7999元起，MateBook Fold非凡大师23999元起，搭载HarmonyOS 5系统，推动国产操作系统发展。

传宇树科技已完成股改，最新估值100亿元以上宇树科技完成股改，或筹备上市，估值超100亿。公司主营四足机器狗和人形机器人，获30余家机构投资，科研市场占比60%。

虚拟稳定币Circle登陆纽交所首日收涨近170% Circle成功在纽交所上市，首日涨幅168.5%，市值超180亿美元，USDC稳定币占全球市场29%。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号