2025年5月20日,Google年度开发者大会Google I/O在加州山景城举办。此次大会展示了至少十多个与AI相关的更新,其中大多数围绕Gemini展开。
Google主要完成了四项核心任务:展示Gemini多模态领先能力;对Gemini AI助手进行全方位升级;让Gemini接管搜索并使全家桶成为通用Agent;推出令人期待的AI+AR眼镜。
尽管AI模型进展已吊足公众胃口,现场焦点仍被“复活”的Google Glass实时demo点燃。演示者Nishta通过这款看似普通的眼镜完成多项复杂操作,包括发送短信、设置静音、识别环境信息及实时翻译对话。
Android XR智能眼镜搭载Gemini Live AI助手,配备镜头、麦克风和可选内置显示器,支持语音互动、拍照、导航及实时翻译等功能。此外,Google计划与Gentle Monster、Warby Parker等品牌合作,但未公布具体价格与上市时间。
Gemini已深度融入Google生态。CEO Sundar Pichai分享了Gemini的多项关键数据:应用月活跃用户超4亿,Gemini Pro使用量增长45%,每月处理token数达480万亿,较去年同期增长50倍;超过700万开发者利用Gemini构建产品。
Pichai强调,Gemini已遥遥领先,并介绍了第七代TPU性能提升10倍的情况。AI渗透推动了Google产品的增长,Search中的AI概览覆盖超15亿用户,在美国和印度市场查询类型增长超10%。
Demis Hassabis分享了Gemini的未来愿景,提出打造全能助手的目标。Project Astra以Gemini Live形式进入Gemini App,展示了其修理自行车的案例,体现了更强的记忆与音频能力。
Gemini App新增多项功能,包括全面开放Gemini Live,允许用户上传资料并在全家桶中打通使用数据库。Chrome浏览器接入Gemini,提供类似通用Agent的功能,能同时完成多达十种任务。
搜索业务彻底Gemini化,首页新增AI Mode,融合Gemini AI能力和Google搜索技术。购物体验也因Gemini得到改进,Virtual Try-on功能让用户可上传照片试穿商品,结合AI Agent实现自动下单提醒。
创作者工具方面,Google推出Flow应用,融合Veo视频生成模型、Imagen图像生成模型与Gemini智能,让用户轻松创作专业级视频。新订阅服务“谷歌AI Ultra”月费高达249.99美元。
大会彩蛋包括Gemini Diffusion模型,用于文本生成,速度极快,输入完成后几乎瞬间完成输出。这暗示了Gemini在模态生成与多模态推理融合上的潜在方向。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。