谷歌云发布第八代TPU:突破内存墙,OCS与液冷技术同步落地

北京时间2026年4月23日凌晨,谷歌云举行Next 2026大会,发布第八代张量处理单元(TPU),包括面向训练的TPU 8t和面向推理的TPU 8i,并宣布其运行于自研Axion ARM CPU平台及第四代液冷系统之上。

TPU 8t单集群支持9600枚芯片,配备2PB共享高带宽内存,芯片间互联带宽较上一代提升一倍,提供121 ExaFlops算力;集成覆盖数万芯片的实时遥测监控、故障链路自动绕过能力,以及基于光路电路交换(OCS)的硬件拓扑自动重构技术;整机计算性能较上一代Ironwood提升近3倍,每瓦性能最高提升两倍。

TPU 8i聚焦突破“内存墙”,搭载288GB高带宽内存(HBM)与384MB片上SRAM,后者为上一代3倍,使模型活跃工作集可完全驻留芯片内部;采用分层Boardfly网络拓扑,由4芯片单元扩展至8板卡本地组,再经OCS互联形成含36个本地组的集群,任意两芯片间通信最多7跳;相较上一代实现80%性价比提升。

谷歌云同步推出Gemini Enterprise代理平台,整合模型选择、代理构建、开发运维、调度与安全治理功能;发布原生集成Gemini的“知识目录”(Knowledge Catalog)数据库,支持从非结构化内容中自动提取实体、映射业务关系;结合“智能存储”功能,在数据上传瞬间完成标签添加、嵌入向量生成与元数据增强。

跨云湖仓(Cross-Cloud Lakehouse)支持AI代理无缝访问存储于亚马逊AWS、微软Azure等外部云环境的数据;深度研究代理可基于全量结构化与非结构化数据回答复杂业务问题,如“导致供应链中断的根本原因”或“对该地区进行财务审计”,精度达此前需数周人力完成的水平。

依托上月完成的320亿美元Wiz收购,谷歌云推出“谷歌云反诈防御平台”,识别机器人、真人及AI代理的合法性与授权状态;Workspace全面升级AI能力,涵盖Gmail智能收件箱助手、跨应用对话驱动的日历会议安排、文档生成及品牌PPT制作;新增“快速企业迁移”功能,将组织级办公环境从微软365迁移至Workspace的速度提升5倍。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2026 All Rights Reserved
蜀ICP备2024059877号-1