杭州海康威视数字技术股份有限公司视觉问答多模态大模型建立方法和装置专利公布(人工智能专利快讯)

天眼查App显示,2025年5月16日,「视觉问答多模态大模型建立方法和装置」正式进入专利公布阶段。申请人为杭州海康威视数字技术股份有限公司,该项人工智能专利涉及视觉问答技术领域。据专利信息显示,该发明显著优化了视觉问答的准确度。发明人为郑仕达、王金。本发明实施例提出了一种视觉问答多模态大模型建立方法和装置,具体包括:获取第一训练数据集,每一条训练数据包含至少一训练图像、一复杂提示词和一最佳回答;复杂提示词包括问题,还涵盖背景文本或约束指令中的至少一项。通过从训练数据集中抽取数据并输入待训练的视觉问答多模态大模型,计算损失值以调整模型参数,直至达到训练结束条件。这一方法有效提升了模型预测的精确性与可靠性。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1