北京达佳互联信息技术有限公司音频生成模型的训练方法、音频生成方法和装置专利公布(音频技术专利快讯)

天眼查App显示,2025年7月22日,「音频生成模型的训练方法、音频生成方法和装置」正式进入专利的公布阶段。申请人为北京达佳互联信息技术有限公司,该项音频技术专利涉及音频生成模型的训练与生成方法。据专利信息显示,该技术通过潜在空间流匹配的方式进行生成式模型训练,结合自注意力机制和交叉注意力机制,实现了生成内容准确性的提升以及训练效率的优化。发明人为周汪劲、李楠、张晨、张迪、于梦蕾、陈睿龙、盖坤。本公开通过以描述文本或者视频为条件引导预测的快速收敛,并通过预测比例谱的形式实现更简单的表达。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1