数字宁波科技有限公司一种基于大语言模型的复杂文本OCR错误识别和修复方法专利公布（计算专利快讯）- DoNews

DoNews > 公司新闻 > 数字宁波科技有限公司一种基于大语言模型的复杂文本OCR错误识别和修复方法专利公布（计算专利快讯）

数字宁波科技有限公司一种基于大语言模型的复杂文本OCR错误识别和修复方法专利公布（计算专利快讯）

2025-06-07 00:44:02

天眼查App显示，2025年6月6日，「一种基于大语言模型的复杂文本OCR错误识别和修复方法」正式进入专利公布阶段。申请人为数字宁波科技有限公司，该项计算领域专利涉及复杂文本处理与OCR错误修正技术。据专利信息显示，该方法实现了显著优化的效果。发明人为李晓儿、李卓、卫学彬、余镭、李雅、吴洵进、张建伟、黄琪兴、梅浩、夏晓瑜和宋天开。

本发明公开了一种基于大语言模型的复杂文本OCR错误识别和修复方法，涉及文本处理技术领域。具体步骤包括：步骤1，文本预处理模块识别并排除OCR生成的初步文本结果中的非文本区域，以确保剩余内容为纯净的文本输入，得到纯文本数据的文本结果；步骤2，错误识别模块利用大语言模型对所述纯文本数据的文本结果进行实体识别，并为识别出的疑似错误提供修订意见；步骤3，数据库为识别的实体以及错误提供知识召回，为后续修复提供补充；步骤4，错误修复模块通过获取的上下文信息和所述数据库提供的补充数据对所述纯文本数据的文本结果中的错误进行修正，并输出文档。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

魏建军“语出惊人”，长城汽车难掩颓势在新能源汽车市场上，长城汽车严重落后。

特斯拉人形机器人Optimus项目负责人将离职；比亚迪股份获南向资金净买入25.95亿港元；“海舶无人船”完成数千万元A轮融资｜Do早报今日早报已为你呈上～

选人选歌、节目的公正度，关于《歌手2025》的热度与争议，我们问了问总监制洪啸 “继续无畏的真。”

快手14周年，程一笑再次强调“用户第一” 与“AI投入” 快手的初心始终未变

传蔚来要给英国迈凯伦超跑造电池了蔚来将为迈凯伦供应4680大圆柱电池，助力其混动车型电动化，同时深化与Forseven合作，重启120度电池包研发。

华为两款鸿蒙电脑今起开售，最低 7999 元起华为发布两款鸿蒙电脑，MateBook Pro售价7999元起，MateBook Fold非凡大师23999元起，搭载HarmonyOS 5系统，推动国产操作系统发展。

传宇树科技已完成股改，最新估值100亿元以上宇树科技完成股改，或筹备上市，估值超100亿。公司主营四足机器狗和人形机器人，获30余家机构投资，科研市场占比60%。

虚拟稳定币Circle登陆纽交所首日收涨近170% Circle成功在纽交所上市，首日涨幅168.5%，市值超180亿美元，USDC稳定币占全球市场29%。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号