谷歌 Gemini 2.5 API 推出“隐式缓存”功能,成本最高可降75%

据科技媒体 WinBuzzer 报道,谷歌为其 Gemini 2.5 API 新增了“隐式缓存”功能。该功能可通过自动识别并重用 API 请求中的常见前缀,帮助开发者将使用成本降低最高达75%。此功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,无需手动配置,系统默认开启,大幅简化操作流程。

为优化缓存效果,谷歌建议将提示词中稳定的内容置于开头,并在短时间内发送相似前缀的请求以提高命中率。此外,API 响应新增“cached_content_token_count”字段,用于展示缓存 Token 的使用情况及优惠计费详情。值得注意的是,隐式缓存对 Token 数量有最低要求:Gemini 2.5 Flash 需1024个 Token,Gemini 2.5 Pro 则需2048个。

尽管谷歌宣称成本节省显著,但实际效果可能因使用模式不同而有所差异,仍待第三方验证。与此同时,显式缓存作为可选方案继续支持自定义内容和生存时间设置。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1