天眼查App显示,2025年8月5日,「模型训练方法、装置、设备及存储介质」专利正式进入专利的公布阶段。申请人为腾讯科技(北京)有限公司,该项计算;推算;计数专利涉及语言模型训练技术领域。据专利信息显示,该方法通过在逐个生成分词的过程中判断停止生成的合理时机,保障语言模型输出文本的结束位置更加合理,技术效果获得显著优化。发明人为尹宇阳。本申请公开了一种模型训练方法、装置、设备及存储介质,涉及计算机技术领域。上述方法包括:获取语言模型的训练样本,该训练样本包括样本提示词和针对样本提示词的第一回应文本;将样本提示词输入语言模型,语言模型用于基于样本提示词生成预测回应文本;在语言模型生成预测回应文本中的第i个分词之后,基于已生成序列,确定停止触发函数值;基于第一回应文本和停止触发函数值,训练语言模型。上述方法能够使得语言模型学习到在逐个生成分词的过程中,停止分词生成的合理时机,进而保障语言模型输出的文本具有较为合理的结束位置。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。