谷歌发布新一代AI图像模型Nano Banana Pro- DoNews

谷歌密集发布人工智能模型。当地时间11月20日，谷歌旗下图像生成模型Nano Banana在推出三个月后迎来更新，基于Gemini 3 Pro搭建的Nano Banana Pro正式上线。

该模型具备更强的控制力、改进的文字呈现和增强的世界知识，可将用户构想转化为高质量设计，在细节表现力、图像分辨率和文本渲染准确性方面均有提升，支持以不同风格、字体和语言生成文本。

Nano Banana Pro的文字渲染能力显著增强，结合多模态理解能力，能直接翻译图片中的文字并保持原有设计风格不变。

模型还改进了局部编辑功能，并集成互联网搜索能力，允许用户选择、优化和调整图像任意部分，包括调整相机角度、焦点、色彩分级及场景光照。其可生成高达2K和4K分辨率的图像，并支持调节宽高比。

在一致性方面，Nano Banana Pro支持最多14张图片输入，在复杂场景生成中保持连贯性，可在结果中维持最多5位人物的一致性和相似度。

谷歌同时宣布，用户现可通过Gemini验证图片是否由谷歌AI生成。所有由谷歌工具生成的内容均嵌入SynthID数字水印，用户可上传图片至Gemini应用查询来源，该功能将逐步扩展至音频和视频。

目前，Nano Banana Pro已在Gemini应用中开放使用，免费用户享有有限额度，超出后将返回基础版Nano Banana模型；Google AI Plus、Pro与Ultra订阅用户享有更高配额。该模型亦从即日起接入Adobe Photoshop与Firefly设计软件。

此前两天，谷歌发布了新一代多模态模型Gemini 3，包含Gemini 3 Pro与推理增强型Gemini 3 Deep Think两个版本，基于TPU训练，在多项基准测试中表现领先。

谷歌CEO桑达尔·皮查伊表示，当前每月有20亿用户使用谷歌搜索的AI概览功能，Gemini应用月活跃用户已超6.5亿。

11月20日，受大盘影响，谷歌（Nasdaq：GOOGL）股价下跌1.03%，收于每股289.98美元，总市值达3.49万亿美元，年内涨幅超50%。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。