天眼查App显示,2025年6月6日,「一种基于大语言模型的复杂文本OCR错误识别和修复方法」正式进入专利公布阶段。申请人为数字宁波科技有限公司,该项计算领域专利涉及复杂文本处理与OCR错误修正技术。据专利信息显示,该方法实现了显著优化的效果。发明人为李晓儿、李卓、卫学彬、余镭、李雅、吴洵进、张建伟、黄琪兴、梅浩、夏晓瑜和宋天开。
本发明公开了一种基于大语言模型的复杂文本OCR错误识别和修复方法,涉及文本处理技术领域。具体步骤包括:步骤1,文本预处理模块识别并排除OCR生成的初步文本结果中的非文本区域,以确保剩余内容为纯净的文本输入,得到纯文本数据的文本结果;步骤2,错误识别模块利用大语言模型对所述纯文本数据的文本结果进行实体识别,并为识别出的疑似错误提供修订意见;步骤3,数据库为识别的实体以及错误提供知识召回,为后续修复提供补充;步骤4,错误修复模块通过获取的上下文信息和所述数据库提供的补充数据对所述纯文本数据的文本结果中的错误进行修正,并输出文档。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。