天眼查App显示,2025年6月3日,「一种多模态数据样本的生成方法及电子设备」正式进入专利公布阶段。申请人为杭州海康威视数字技术股份有限公司,该项计算专利涉及数据处理技术领域,尤其适用于多模态数据样本生成场景。据专利信息显示,该技术能够显著优化多模态数据处理的准确性和效率。发明人为朱江、任文奇、谭文明、尚兴帆、王嘉伟和曹达。
该专利公开了一种多模态数据样本的生成方法及电子设备。具体包括将原始多模态数据输入大型语言模型(LLM),基于prompt提示词获取工具调用指令,并在提示词中添加工具描述词。根据工具调用指令选择调用的模型,执行任务信息对应的任务,最终得到数据处理结果。通过工具描述词中的验证方式及工具调用响应格式,对数据处理结果进行数据验证,若验证成功,则利用数据处理结果和原始多模态数据进行强化学习,生成增强的多模态数据样本。此方法有效克服了无引导的LLM指令生成混乱、不合理的缺陷,极大提升了多模态数据处理的准确性与效率。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。