天眼查App显示,2025年7月18日,「文本到图像生成方法、设备、介质及产品」正式进入专利的公布阶段。申请人为中国联合网络通信集团有限公司、联通数字科技有限公司,该项人工智能专利涉及文本到图像生成技术领域。据专利信息显示,该技术通过构建多阶段对齐系统,实现文本生成图像的效率和质量提升达显著优化。发明人为高焕霖、石芙源、赵放、王恺、廉士国。本申请提供一种文本到图像生成方法、设备、介质及产品,包括:获取文本到图像生成任务对应的第一扩散模型和第一自监督模型,并获取第一映射器;获取预处理样本数据;根据第一扩散模型、第一自监督模型和第一映射器,建立第一阶段对齐系统;根据预处理样本数据,对第一阶段对齐系统进行第一阶段对齐处理,以得到第二自监督模型和第二映射器;在第一扩散模型上挂载加速模块,并建立关系对齐模块;根据挂载有加速模块的第一扩散模型、第二自监督模型、第二映射器和关系对齐模块,建立第二阶段对齐系统;根据预处理样本数据,对第二阶段对齐系统进行第二阶段对齐处理,以得到目标扩散模型,实现文本到图像生成。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。