4月22日,OpenAI发布图像生成模型ChatGPT Images 2.0,随即登顶Image Arena全部排行榜,在文生图总榜以242分优势夺冠,创该平台最大分差纪录;在文本渲染、肖像、卡通动漫等细分榜单亦位列第一。
Images 2.0引入“思考模式”,可在生成前对任务进行拆解规划、检索实时信息、基于单提示词生成多版本图像并自我复核。模型显著提升对中文、日文等非拉丁文字的精准渲染能力,突破长期存在的文字识别与排版失真难题。
澎湃新闻记者实测显示:输入‘生成一张马斯克直播推介澎湃新闻的图片’,模型准确呈现澎湃新闻Logo及中文全称,并融合‘专业、深度、原创’定位特征,评论区内容符合马斯克语态风格;指令‘巴菲特推荐澎湃财经频道’生成结果中,手机端App UI界面还原度高;‘年轻记者在珠峰举澎湃新闻旗帜’一图完整呈现雪山背景、碎石地貌、海拔标识牌及旗帜中英文标识,字体与品牌视觉系统一致;‘《新引擎》周刊封面:20年后的上海’一次性生成含‘东方明珠’‘黄浦江’等中文字样的排版清晰封面,未出现笔画扭曲或乱码;‘《超级投资人》节目对话罗杰斯分镜图’中人物外貌、衣着、光影逻辑高度统一,无典型AI换脸或肢体变形;‘人形机器人半马四格漫画’补充了比赛地点、途中故事与完赛时间等细节;‘超级马里奥挑战灭霸’游戏界面亦被准确生成。
所有测试均使用单句自然语言提示,未作提示词优化,生成耗时为十几秒至数分钟。图像支持一键修改尺寸。但模型仍存在局限:马斯克手持App中文章标题小字错乱,且澎湃新闻未推出年度会员产品;《新引擎》封面中建筑楼体歪曲,新闻发布日期错误标注为‘2024年’,与‘20年后’设定矛盾;因知识截止于2025年12月,对人形机器人等前沿领域仅能调用截至该时间的信息,如所生成漫画依据的是2025年首届人形机器人半马赛事;多组直播截图呈现视觉风格同质化倾向;当前模型向所有ChatGPT及Codex用户开放,但免费用户日限额约5次,含思维链功能的高级输出仅限Plus、Pro与Business订阅用户使用。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



