通义千问开源首图文生图模型Qwen-Image

全新文生图模型Qwen-Image现已正式开源,这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。

Qwen-Image的主要特性包括:卓越的文本渲染能力,在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现,无论是英语还是中文,均能实现高保真输出;一致性的图像编辑能力,通过增强的多任务训练范式,在编辑过程中能出色地保持编辑的一致性;强大的跨基准性能表现,在多个公开基准测试中的评估表明,在各类生成与编辑任务中均获得SOTA,是一个强大的图像生成基础模型。

用户如需体验Qwen-Image,可通过QwenChat(chat.qwen.ai)平台并选择“图像生成”功能,同时该模型已在魔搭社区与Hugging Face开源,欢迎体验。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1