全新文生图模型Qwen-Image现已正式开源,这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。
Qwen-Image的主要特性包括:卓越的文本渲染能力,在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现,无论是英语还是中文,均能实现高保真输出;一致性的图像编辑能力,通过增强的多任务训练范式,在编辑过程中能出色地保持编辑的一致性;强大的跨基准性能表现,在多个公开基准测试中的评估表明,在各类生成与编辑任务中均获得SOTA,是一个强大的图像生成基础模型。
用户如需体验Qwen-Image,可通过QwenChat(chat.qwen.ai)平台并选择“图像生成”功能,同时该模型已在魔搭社区与Hugging Face开源,欢迎体验。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。