天眼查App显示,2025年6月6日,「基于大模型数据蒸馏的数据库查询方法、系统、设备及介质」正式进入专利公布阶段。申请人为浪潮卓数大数据产业发展有限公司,该项数据库技术专利涉及利用蒸馏技术提取高质量训练数据并优化复杂查询,提升执行效率。据专利信息显示,该技术显著优化了数据库查询效率,并确保查询结果的准确性与用户需求匹配度。发明人为傅玉鑫、赵子墨、孙永超、邱阳。
本发明提出了一种基于预训练大语言模型的方法,从多种数据源中提取与数据库查询相关的知识,生成高质量的训练数据集;通过蒸馏技术实现教师模型对学生模型的知识传递,并通过优化损失函数训练轻量化模型;学生模型能够解析用户输入的自然语言查询并生成对应的SQL语句;同时,基于学生模型的预测结果对数据库执行计划进行优化,进一步提升查询效率。最终通过模型预测结果对查询返回的内容进行验证与调整,确保查询结果的质量和相关性。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。