天眼查App显示,2025年7月15日,「用于查询处理的方法、装置、设备和存储介质」专利正式进入专利的公布阶段。申请人为北京字跳网络技术有限公司、字节跳动技术有限公司,该项计算领域专利涉及视频与多模态信息交互处理的技术场景。据专利信息显示,该技术基于视频、参考图像和查询构建模型输入,并通过经训练的第一多模态模型生成应答内容,实现了对复杂多模态查询任务的突破性进展。发明人为张舸、黄文灏、靳潇杰、马德华、张远行。本公开的实施例提供了用于查询处理的方法、装置、设备和存储介质。该方法包括:获取视频、与视频相关联的参考图像和针对视频的查询,查询指示与视频和参考图像相关的问题;基于视频、参考图像和查询,构建针对经训练的第一多模态模型的模型输入;以及通过将模型输入提供给第一多模态模型,获得模型输出,模型输出指示对问题的应答。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。