天眼查App显示,2025年8月1日,「LLM驱动的复杂报表OCR错误自校正方法及系统」正式进入专利的公布阶段。申请人为浙江孚临科技有限公司,该项计算;推算;计数专利涉及复杂报表图像数据的OCR处理与字段智能纠错。据专利信息显示,该技术通过融合大语言模型、指针生成网络与多臂老虎机机制,实现了复杂报表中字段的智能纠错与结构化重建,带来显著优化。发明人为唐科伟;陈声鸿;肖非。本发明公开了LLM驱动的复杂报表OCR错误自校正方法及系统,包括如下步骤:S1、获取复杂报表图像数据,执行OCR处理,构建原始字段数据集;S2、提取上下文信息,识别语义矛盾字段,生成待校正字段集合;S3、指针生成网络生成多个字段修正候选,形成候选字段集合;S4、构建多臂老虎机模型,选择最优字段修正结果,形成修正字段输出集合;S5、执行版式分析,提取图表标题字段、图例字段与数据区域文本;S6、图表结构语义一致性机制,生成图表标题字段的修正字段结果;S7、字段还原与版式重建,输出结构化报表数据。本发明通过融合大语言模型、指针生成网络与多臂老虎机机制,实现了复杂报表中字段的智能纠错与结构化重建。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。