2026年2月4日,SK海力士发布论文,提出H³混合存储架构,融合HBM高带宽内存与HBF高带宽闪存。该架构将HBF作为HBM的二级扩展,专存只读数据,HBM处理其余数据。其采用中介层互连Base Die,集成延迟隐藏缓冲与HBF控制器。设计面向大语言模型(LLM)推理,尤其适用于共享预计算键值缓存场景。仿真显示,相较纯HBM系统,H³使GPU单位功耗吞吐量提升2.69倍。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。
2026年2月4日,SK海力士发布论文,提出H³混合存储架构,融合HBM高带宽内存与HBF高带宽闪存。该架构将HBF作为HBM的二级扩展,专存只读数据,HBM处理其余数据。其采用中介层互连Base Die,集成延迟隐藏缓冲与HBF控制器。设计面向大语言模型(LLM)推理,尤其适用于共享预计算键值缓存场景。仿真显示,相较纯HBM系统,H³使GPU单位功耗吞吐量提升2.69倍。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。