天眼查App显示,2025年6月17日,「文档标题层级的确定方法、装置及存储介质」正式进入专利公布阶段。申请人为珠海金山办公软件有限公司、北京金山办公软件股份有限公司、武汉金山办公软件有限公司,该项计算技术专利涉及文本处理与文档分析领域。据专利信息显示,通过该技术可显著优化文档标题识别准确率,提升达突破性进展。发明人为吴鹏杰、罗志旺。 「本申请涉及一种文档标题层级的确定方法、装置及存储介质,所述方法包括:获取目标文档,并获取所述目标文档的目标文档页面中的文本行,存储至标题候选行集合;提取所述标题候选行集合中每个所述文本行的基本特征向量以及优化特征向量;根据所述基本特征向量以及所述优化特征向量,确定所述标题候选行集合中的文档标题,并确定所述文档标题的标题层级。如此提取标题候选行集合中每个文本行的基本特征向量以及优化特征向量,根据基本特征向量以及优化特征向量,确定标题候选行集合中的文档标题,相较于基于规则的方法,可以提高文档标题的识别准确率。」
免责声明:本文内容由开放的智能模型自动生成,仅供参考。