天眼查App显示,2025年6月3日,「一种监督微调数据构造方法、装置、电子设备及存储介质」正式进入专利公布阶段。申请人为度小满科技(北京)有限公司,该项人工智能专利涉及监督微调数据的生成技术,旨在优化大模型的数据处理能力。据专利信息显示,该方法通过利用预设大模型改写源数据格式,显著优化了目标监督微调数据的生成质量,避免了大模型幻觉问题可能导致的生成错误数据。发明人为王子扬、杨青。 「本发明提供一种监督微调数据构造方法、装置、电子设备及存储介质,方法包括:获取源数据,所述源数据为由问题数据以及指令数据构成的<问题,指令>组数据,所述源数据来源于多个数据集;将所述源数据以及预设构造条件输入至预设大模型中,以使所述预设大模型按照所述预设构造条件修改所述源数据的格式,得到符合所述预设构造条件的目标<问题,指令>组,作为目标监督微调数据。通过利用大模型按照预设构造条件,改写源数据格式得到目标监督微调数据,而不利用大模型直接生成数据,避免大模型幻觉问题可能导致的生成错误数据,提高了监督微调数据的生成质量。」
免责声明:本文内容由开放的智能模型自动生成,仅供参考。