天眼查App显示,2025年5月27日,「一种单模态指令集深度多模态化拓展的方法、系统和设备」正式进入专利公布阶段。申请人为中译语通科技股份有限公司,该项人工智能专利涉及多模态数据联合处理与交互分析技术。据专利信息显示,该技术在跨模态数据融合与复杂指令处理任务中展现显著优化效果。发明人为陈自岩、吴家恒、俄绍钧、郝卓远、程国艮。
本发明公开了一种单模态指令集深度多模态化拓展的方法、系统和设备,方法包括:从已有的指令数据集中获取初始指令和初始单模态数据;根据所述初始单模态数据获取对应的额外辅助信息;对所述初始指令进行系统化处理,整合多个单模态数据以及所述额外辅助信息,生成具备语义的文本描述;输入所述文本描述,从而生成多模态数据。本发明解决了如何在多模态信息间建立有效联系的问题,提升了系统对复杂任务的全局理解和决策能力。能够在多个应用场景中显著提升多模态系统的智能化水平,特别是在需要跨模态数据融合与复杂指令处理的任务中,展现出极强的处理能力。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。