天眼查App显示,2025年5月27日,「大语言模型训练、信息处理方法、装置、设备及介质」正式进入专利的公布阶段。申请人为北京中科闻歌科技股份有限公司,该项人工智能专利涉及大语言模型的训练与优化。据专利信息显示,通过将大语言模型的解释结果融入训练过程,训练完成的大语言模型性能实现显著优化。发明人为郭苏颖、王宇琪、刘宏宇、徐楠、仲维建、张西娜、罗引、王磊。 「本公开提供了一种大语言模型训练方法,包括获取第一训练文本,基于待训练大语言模型计算第一训练文本中各个token分别对应的期望梯度值;对各个token分别对应的期望梯度值进行融合处理,得到正则化项;基于正则化项对待训练大语言模型进行无监督预训练,得到第一大语言模型;获取第二训练文本,基于第二训练文本对应的目标正则化项对第一大语言模型进行有监督指令微调,得到第二大语言模型,将第二大语言模型确定为训练完成的大语言模型,由此提高了训练完成的大语言模型的性能。」
免责声明:本文内容由开放的智能模型自动生成,仅供参考。