阿里云通义千问日前发布全新多模态模型Qwen VLo,该模型在理解与生成能力上实现突破,用户可通过Qwen Chat平台体验。Qwen VLo采用渐进式生成机制,支持动态分辨率输入输出,能逐步构建并优化图像内容,确保视觉效果的和谐一致。其创新性生成方式尤其适用于长文本或精细场景的创作,如广告设计、漫画分镜等。
模型亮点包括精准语义理解与再创造、开放指令编辑及多语言支持。例如,用户可通过自然语言指令调整图片风格、修改细节或重构场景,甚至实现复杂的多任务编辑。目前,Qwen VLo仍处于预览阶段,开发团队正持续优化生成准确性与一致性。