北京智慧星光信息技术股份有限公司基于多模态图生文大模型的视频分析方法专利公布（人工智能专利快讯）- DoNews

DoNews > 公司新闻 > 北京智慧星光信息技术股份有限公司基于多模态图生文大模型的视频分析方法专利公布（人工智能专利快讯）

北京智慧星光信息技术股份有限公司基于多模态图生文大模型的视频分析方法专利公布（人工智能专利快讯）

2025-05-13 23:51:02

天眼查App显示，2025年5月13日，「基于多模态图生文大模型的视频分析方法、装置、设备」正式进入专利公布阶段。申请人为北京智慧星光信息技术股份有限公司，该项人工智能专利涉及视频分析技术领域。据专利信息显示，该发明通过结合目标检测的方式防止生成无效文本信息，显著优化了视频分析效率和时效性，同时通过加入矩阵级噪音扰动提高图生文大模型训练的泛化能力，突破性进展使模型能更加准确地进行图像描述。发明人为韩勇、李青龙、骆飞、赵冲。

本发明通过对目标检测模型进行训练，将目标场景作为先验知识创建目标图像描述任务指令，从而聚焦视频中的重点场景更好地生成需要重点关注的图片描述。通过将两个模态输入融合对齐，将文本序列与交叉注意力之后输出矩阵的融合，使得模型能更好地理解指令并更好地生成文本描述，提高模型对视频内容理解的准确性。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

vivo开启顶尖人才招募计划：涉及芯片、AI大模型等领域薪酬上不封顶。

CGL创始人庄华去世：时年62岁在健身房突发心脏病哀悼。

日产交出 20 余年来最差成绩单：2024 财年净亏 45 亿美元正重组。

长安启源全新轿车官宣命名A06，下半年上市中型轿车。

鸿海 2025 年 Q1 净利润同比大增 91%：AI 服务器业务表现亮眼 MODEL B 下半年量产。

《折腰》除了刘宇宁，还有啥槽点吗？四星观望，值得一看

销量承压，生态缺位，COLMO如何挑起美的高端化？该要如何破局。

哪吒汽车内部人士回应破产：法院确有受理流程复杂。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号