阿里通义千问发布Qwen-Image-Edit-2509并开源

阿里通义千问宣布推出Qwen-Image-Edit的迭代版本Qwen-Image-Edit-2509,已在HuggingFace和魔搭社区开源,用户可通过Qwen Chat选择“图像编辑”功能免费体验。

相较于8月版本,Qwen-Image-Edit-2509新增多项特性。在多图编辑方面,模型基于原有结构通过拼接方式训练,支持“人物 + 人物”、“人物 + 商品”、“人物 + 场景”等多种组合输入。

单图编辑的一致性能力显著增强。人物编辑方面,提升人脸ID保持效果,支持多种形象照片生成及姿势变换;商品编辑方面,增强商品ID保持,适用于商品海报制作;文字编辑方面,在支持内容修改基础上,新增字体类型、颜色及材质编辑功能。

该版本原生支持ControlNet常用图像条件控制,包括深度图、边缘图、关键点图等,可用于姿态调整、草图引导等任务。

官方展示了多图输入示例,涵盖“人物+人物”、“人物+场景”、“人物+物体”等组合,并演示了结合关键点图改变人物姿势的效果,以及三张图片联合输入的应用场景。

在人物一致性方面,新版本能更准确保持身份特征,适用于形象照生成、姿势更改、老照片修复,以及卡通玩偶和文创内容生成。

商品一致性优化后,可基于白底商品图自动生成自然的商品海报或logo设计。文字编辑能力提升后,支持定点文字修改,并实现文字与图像编辑融合,适用于海报修改等复杂任务。

ControlNet支持覆盖关键点控制、草图引导等多种条件输入,进一步扩展了模型在精细化图像编辑中的应用范围。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1