多模态大模型的训练方法、装置及电子设备

天眼查App显示,北京百度网讯科技有限公司近日公开了一项名为“多模态大模型的训练方法、装置及电子设备”的发明专利(专利号:CN202411367548.X)。该专利涉及人工智能技术领域,特别是深度学习、自然语言处理、计算机视觉和语音技术等。具体而言,该发明提出了一种获取第一训练数据和第二训练数据,并利用初始的多模态大模型进行联合训练的方法。多模态大模型包括骨干网络以及各个非文本模态对应的编解码网络,这些编解码网络结合同一个多模态词表进行编解码处理,从而降低了模型训练难度和成本。通过结合第一训练数据中的非文本模态数据对编解码网络和多模态词表进行联合训练,再利用第二训练数据中的目标任务样本数据对骨干网络进行训练,实现了高效且低成本的多模态大模型训练方案。该专利公布日期为2025年1月3日。

风险警告:本文根据网络内容由AI生成,内容仅供参考,不应作为专业建议或决策依据。用户应自行判断和验证信息的准确性和可靠性,本站不承担可能产生的任何风险和责任。内容如有问题,可联系本站删除。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1