度小满科技(北京)有限公司模型训练方法专利公布(人工智能专利快讯)

天眼查App显示,2025年6月20日,「模型训练方法、装置、存储介质及电子设备」正式进入专利的公布阶段。申请人为度小满科技(北京)有限公司,该项人工智能专利涉及大语言模型训练技术领域。据专利信息显示,通过减少模型训练成本,可显著优化大语音模型的性能。发明人为霍亮宇。 「本发明提供一种模型训练方法、装置、存储介质及电子设备,该方法包括:调用N个初始大语言模型,分别生成初始训练文本数据集中的各个初始训练文本数据下的多轮对话数据;基于各个初始大语言模型的模型质量指示数据和各个初始训练文本数据下的多轮对话数据,构建各个初始训练文本数据下的原始偏序对话数据集,以确定各个初始训练文本数据下的校正偏序对话数据集;基于各个初始训练文本数据下的校正偏序对话数据集,分别对各个初始大语言模型进行模型训练,得到N个模型训练后的大语言模型;并基于N个模型训练后的大语言模型,确定N个目标大语言模型。本发明实施例可在减少模型训练成本的情况下,提高大语音模型的模型性能。」

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1