周三美股开盘后,存储板块逆势走弱,美光科技跌3.57%、闪迪跌4.12%,西部数据和希捷科技同步下跌。
市场异动与谷歌当日发布的新型压缩算法TurboQuant直接相关。该技术针对大语言模型及向量搜索引擎中日益突出的键值缓存(key-value cache)内存瓶颈问题,旨在降低AI系统内存占用。
TurboQuant可在不重新训练或微调模型的前提下,将键值缓存压缩至3bit精度,基本保持模型准确率不变。对Gemma、Mistral等开源模型的测试显示,其可实现约6倍的键值缓存内存压缩效果。
在英伟达H100加速器上的测试表明,该算法相较未量化键向量最高可带来约8倍性能提升。研究团队指出,该技术适用范围不限于大模型推理,亦可提升大规模搜索引擎的向量检索效率。
谷歌计划于2026年4月举行的国际学习表征会议(ICLR 2026)上正式展示TurboQuant技术。
富国银行TMT分析师Andrew Rocha指出,随着上下文窗口扩大,KV缓存数据规模呈爆炸式增长,推高内存容量需求;TurboQuant直击该成本曲线,若获广泛应用,将显著影响内存成本结构及未来容量规格判断。
Rocha同时强调,当前尚不明确该技术是否兼容非谷歌体系的AI实验室,且实验室测试结果向真实生产环境的转化能力仍待验证。
作为技术发布方,谷歌股价当日一度跌破290美元,较2月初创下的349美元历史高点回落近17%,逼近20%回撤关键心理位。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。



