谷歌发言人亚历克斯・约瑟夫近日向The Verge确认,谷歌已开始向Gemini Live推出新的人工智能功能。这些功能使Gemini Live能够“看到”用户的屏幕内容或通过智能手机摄像头获取画面,并实时回答相关问题。这一功能的推出,距离谷歌首次展示其技术支持的“阿斯特拉项目”(Project Astra)已近一年。
去年5月,谷歌在2024年I/O开发者大会上展示了基于Gemini的Project Astra项目,该项目可在Pixel手机上本地运行,被视为对标OpenAI GPT-4o的最新模型。谷歌表示,Project Astra是其最新的多模态AI项目,用户通过打开摄像头,该多模态项目可以直接解释画面中的物品。