在今日举行的2025年I/O开发者大会上,谷歌正式发布端侧多模态AI模型Gemma 3n。该模型可在手机、平板及笔记本电脑本地运行,支持处理音频、文本、图片和视频等多种数据类型。
据产品经理Gus Martins介绍,Gemma 3n采用与Gemini Nano相同的架构,但性能更优,能在内存低于2GB的设备上流畅运行。通过谷歌DeepMind研发的Per-Layer Embeddings(PLE)技术,模型内存占用大幅降低,5B和8B参数版本的占用仅相当于2B和4B模型。此外,结合KVC共享和高级激活量化技术,其在移动端的响应速度提升1.5倍,且在多语言处理(如日语、德语等)方面表现突出。
目前,用户可直接通过Google AI Studio在浏览器体验Gemma 3n,开发者则能借助Google AI Edge集成其本地功能。