天眼查App显示,2025年6月3日,「一种多语言大语言模型训练方法、多语言问答方法及装置」正式进入专利公布阶段。申请人为度小满科技(北京)有限公司,该项人工智能专利涉及多语言大语言模型的训练与应用技术。据专利信息显示,通过该技术可显著优化多语言大语言模型在跨多种语言上的理解能力,并扩展其在资源较小硬件设备中的部署范围。发明人为李俊辰、杨青。 「本申请提供了一种多语言大语言模型训练方法、多语言问答方法及装置,通过获取多种不同语言类型的问答组合样本以及训练任务指令,利用不同的问答组合样本中的问题样本、答案样本,结合训练任务指令指示的多语言大语言模型预期达到的训练效果,对多语言大语言模型进行训练,直至该多语言大语言模型输出的结果满足训练任务指令要求。如此,在小语种训练样本资源匮乏的情况下,借助训练任务指令将非英文的样本数据转换为英文样本数据后,以英文样本数据作为训练中间样本进行模型训练,以提高多语言大语言模型在跨多种语言上的理解能力,有利于将训练得到的目标多语言大语言模型部署至资源较小的硬件设备中,扩展了多语言大语言模型的应用范围。」
免责声明:本文内容由开放的智能模型自动生成,仅供参考。