天眼查App显示,2025年9月12日,「文档解析方法、装置、电子设备及存储介质」正式进入专利的公布阶段。申请人为北京万方数据股份有限公司,该项计算专利涉及文档处理技术领域。据专利信息显示,该技术采用模块化和插件化的设计理念,不仅简化了文档内容识别过程,还提高了系统的可扩展性,使其更加灵活。发明人为张富涛、梅葆瑞、连春月、杨赛军。该方法包括:获取待解析的文档;根据针对各个文档部分预设的标志性表述,逐段确定文档中每一段落所属的文档部分;加载多个解析器;每个解析器与一种文档部分和一种文本内容对应,用于根据对应的解析规则,解析对应文档部分中的对应文本内容;通过多个解析器对文档进行逐段落解析,其中,对于每一段落,根据段落所属文档部分对应的各个解析器对段落进行解析,获得段落中的各个文本内容。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。