数字宁波科技有限公司「一种基于大语言模型的复杂文本解析和处理系统及方法」专利公布(人工智能专利快讯)

天眼查App显示,2025年6月6日,「一种基于大语言模型的复杂文本解析和处理系统及方法」正式进入专利公布阶段。申请人为数字宁波科技有限公司,该项人工智能专利涉及文本解析和处理技术领域。据专利信息显示,该系统通过预处理模块、多模态解析模块、大语言模型整理模块、实体抽取模块和数据库存储模块等实现复杂文本的高效解析与处理,显著优化了文本处理效率和准确性。发明人为卫学彬、李晓儿、李卓、余镭、李雅、吴洵进、张建伟、梅浩、夏晓瑜、李晓栋、张彦璐。本发明公开了一种基于大语言模型的复杂文本解析和处理系统及方法,具体包括:预处理模块接收复杂文本并进行格式检测,对于非编码格式文本转换为图片文件;多模态解析模块使用多模态大模型识别和提取图片中的文本信息,并将图片文件转换为可编码格式的文本数据;大语言模型整理模块进行语义分析和错误修正,同时对输出文本的格式和布局进行整理;实体抽取模块从输出文本中抽取实体信息;数据库存储模块将实体信息存放进数据库,实现结构化存储。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1