天眼查App显示,2025年5月16日,「一种模型训练及图像描述生成方法、装置、设备及介质」正式进入专利公布阶段。申请人为云知声智能科技股份有限公司,该项人工智能专利涉及图像描述生成技术领域。据专利信息显示,该技术能够显著优化图像描述的准确性与贴合度,同时减少生成错误或不相关描述的概率。发明人为杨梦诗、刘升平、梁家恩。 「本申请公开了一种模型训练及图像描述生成方法、装置、设备及介质。通过引入正向和负向图像描述作为参考图像描述,图像描述生成模型在训练过程中不仅学习如何生成符合图像内容的正向描述,还能学会区分与图像不匹配的负向描述。这使得模型生成的图像描述更加准确、细致和贴合实际图像内容,减少生成错误或不相关描述的概率。迭代微调过程结合增量优化损失函数,促使模型在基础模型的能力之上不断优化,该模型能够适应各种类型的图像和多样化的上下文信息,从而提高其在不同数据集和场景下的泛化能力。该训练完成的图像描述生成模型在生成图像描述时,可以引入图像的上下文信息,从而避免单一图片输入造成的描述偏差。」
免责声明:本文内容由开放的智能模型自动生成,仅供参考。