谷歌发布最强图像模型Gemini 2.5 Flash Image- DoNews

DoNews8月27日消息，据第一财经报道，当地时间8月26日，谷歌发布了其最新的图像生成和编辑模型Gemini 2.5 Flash Image，并迅速登顶多个主流图像排行榜，成为新晋性能冠军。

上周一款名为“nano-banana”的模型出现在大模型竞技场中，开始接受用户的匿名体验和打分，目前投票数超过250万。如今谜底揭晓，“nano-banana”正是Gemini 2.5 Flash Image。

在大模型竞技场LMArena的文生图与图像编辑两个场景，谷歌的图像模型均拿下全球第一，在图像编辑榜单上模型表现尤为出色，获得1362的高分，以171分的差距领先第二名flux-1-knotext-max。

知名AI基准测试机构Artificial Analysis同样获得了早期访问权限，并在过去一周以“rex”的化名在竞技场中进行了测试。目前谷歌的模型在图像编辑方面排名第一，超过了OpenAI的GPT-4o和国内阿里的Qwen-Image-Edit，在文生图方面则略逊于字节Seedream 3.0和GPT-4o，排名第三。

Artificial Analysis还做了一个对比测试，给出了一张图，让谷歌、阿里通义和OpenAI三家的模型生成新的照片：在自行车后座上加一名乘客，并将地点更改为内蒙古的草原。

从输出结果看，千问的图像模型未能准确进行指令跟随，在画面真实度上，谷歌的模型表现则比GPT-4o更为突出。

谷歌称，Gemini 2.5 Flash Image的核心亮点是图像编辑能力，这一模型可将多个图像混合到一幅图像中，保持高度的角色一致性，还能使用自然语言进行有针对性修改，并充分利用Gemini的世界知识来生成和编辑图像。