天眼查App显示,2025年5月27日,「一种基于极坐标体系的大模型量化压缩方法及系统」正式进入专利公布阶段。申请人为哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)、深圳市道通智能航空技术股份有限公司、智洋创新科技股份有限公司,该项人工智能领域专利涉及大语言模型的低成本硬件部署与推理效率优化。据专利信息显示,该技术能够显著优化大模型在实际应用中的性能表现。发明人为吴建龙、岳宇轩、聂礼强、汪康利、胡志坤、张万征、张淼、万佳。 「本发明属于人工智能技术领域,为解决现有的大语言模型量化方法无法同时保障大模型的低成本硬件部署和推理效率的问题,提供一种基于极坐标体系的大模型量化压缩方法及系统。其中,基于极坐标体系的大模型量化压缩方法包括从第一存储单元中调取预存的大语言模型的原始权重参数分布,并将其处理成标准高斯分布,得到相应符合标准高斯分布的权重矢量,再转化为对应极坐标表征;分别构建各个所述极坐标表征的方向码本和模长码本,得到符合分布特征和量化敏感度特性的矢量码本并传输至第二存储单元进行存储。其能够同时保障大模型的低成本硬件部署和推理效率。」
免责声明:本文内容由开放的智能模型自动生成,仅供参考。