天眼查App显示,2025年5月30日,「一种数据搜索增强重排方法、系统及设备」正式进入专利公布阶段。申请人为中铁电气化局集团有限公司,该项计算专利涉及数据搜索增强技术领域,旨在解决现有RAG技术因局部匹配、单一表征和噪声干扰导致准确率低的问题。据专利信息显示,通过结合多种语义特征,搜索准确率实现显著优化。发明人为林云志、杨柳、裴宁、张浩宇、罗金、司丙楠。 「本发明包括构建关键词库;将专业知识及文档分割为多个文本块,生成第一高维特征向量;对每个文本块语义分割,提取各语义单元的第二高维特征向量;提取查询信息的关键词、各改写查询的高维特征向量;筛选与查询信息的关键词匹配的多个文本块;将查询信息的关键词对应的高维特征向量与第一高维特征向量进行匹配,并基于转移概率距离进行二次筛选;计算改写查询对应的高维特征向量与二次筛选后的第二高维特征向量的球散度距离,并进行重排。本发明结合多种语义特征,提升了搜索准确率。」
免责声明:本文内容由开放的智能模型自动生成,仅供参考。