浙江省公安科技研究所等「一种基于多模态模型进行搜索的方法和系统」专利公布(人工智能专利快讯)

天眼查App显示,2025年5月6日,「一种基于多模态模型进行搜索的方法和系统」正式进入专利公布阶段。申请人为浙江省公安科技研究所、浙江大学、浙江宇视科技有限公司、浙江大华技术股份有限公司,该项人工智能专利涉及多模态模型的搜索方法与系统。据专利信息显示,该技术实现了显著优化。发明人为孙斌、靳加彬、楼宏良、郑挺、许婷婷、陈波、张可鑫、王蒙蒙、张超、潘华东。本发明公开了一种基于多模态模型进行搜索的方法和系统。方法包括:对视频进行分割,将视频各帧中,前后连贯且相似度高于阈值的帧集合,作为一个场景单元;对场景单元进行关键帧提取;对关键帧进行图像特征和文本特征提取;将关键帧图像特征和文本向量特征进行融合,得到反映场景单元内容的多模态特征;对用户输入的自然语言查询进行语义理解,将其转换为相应的查询特征向量;将查询特征向量与数据库中的多模态特征向量进行相似性计算,根据相似度对场景单元进行排序,返回最相似的场景单元;将检索到的场景单元按照相似度排序后呈现给用户。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1