天眼查App显示,2025年5月27日,「一种四模态对齐数据合成加工的方法、系统和设备」正式进入专利公布阶段。申请人为中译语通科技股份有限公司,该项计算领域专利涉及多模态数据对齐技术的创新与应用。据专利信息显示,该技术在多模态数据对齐的精度、多样性、一致性评估和自动化处理等方面实现了显著优化。发明人为姜威、杨宇辰、陈自岩、张延。 「本发明公开了一种四模态对齐数据合成加工的方法、系统和设备,方法包括:通过分别设计精细提示词和简略提示词,实现文本模态数据对图像、视频和音频数据的对齐;再从视频中提取文本、音频和图像数据,将文本与视频对齐、图像与视频对齐以及音频与视频对齐,从而实现以视频为核心的四模态对齐;以视频为核心的四模态对齐后,计算两个单模态之间的余弦相似度,根据所述余弦相似度评估数据对齐效果。本发明在多模态数据对齐的精度、多样性、一致性评估和自动化处理等方面有显著改进,具备广泛的应用前景和技术优势。」
免责声明:本文内容由开放的智能模型自动生成,仅供参考。