谷歌发布新一代AI图像模型Nano Banana Pro

谷歌密集发布人工智能模型。当地时间11月20日,谷歌旗下图像生成模型Nano Banana在推出三个月后迎来更新,基于Gemini 3 Pro搭建的Nano Banana Pro正式上线。

该模型具备更强的控制力、改进的文字呈现和增强的世界知识,可将用户构想转化为高质量设计,在细节表现力、图像分辨率和文本渲染准确性方面均有提升,支持以不同风格、字体和语言生成文本。

Nano Banana Pro的文字渲染能力显著增强,结合多模态理解能力,能直接翻译图片中的文字并保持原有设计风格不变。

模型还改进了局部编辑功能,并集成互联网搜索能力,允许用户选择、优化和调整图像任意部分,包括调整相机角度、焦点、色彩分级及场景光照。其可生成高达2K和4K分辨率的图像,并支持调节宽高比。

在一致性方面,Nano Banana Pro支持最多14张图片输入,在复杂场景生成中保持连贯性,可在结果中维持最多5位人物的一致性和相似度。

谷歌同时宣布,用户现可通过Gemini验证图片是否由谷歌AI生成。所有由谷歌工具生成的内容均嵌入SynthID数字水印,用户可上传图片至Gemini应用查询来源,该功能将逐步扩展至音频和视频。

目前,Nano Banana Pro已在Gemini应用中开放使用,免费用户享有有限额度,超出后将返回基础版Nano Banana模型;Google AI Plus、Pro与Ultra订阅用户享有更高配额。该模型亦从即日起接入Adobe Photoshop与Firefly设计软件。

此前两天,谷歌发布了新一代多模态模型Gemini 3,包含Gemini 3 Pro与推理增强型Gemini 3 Deep Think两个版本,基于TPU训练,在多项基准测试中表现领先。

谷歌CEO桑达尔·皮查伊表示,当前每月有20亿用户使用谷歌搜索的AI概览功能,Gemini应用月活跃用户已超6.5亿。

11月20日,受大盘影响,谷歌(Nasdaq:GOOGL)股价下跌1.03%,收于每股289.98美元,总市值达3.49万亿美元,年内涨幅超50%。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1