夸克扫描王亮相中国图象图形大会,用高质量数据提高多模态识别可靠性

近日,中国图象图形大会(CCIG 2024)在西安召开,3000余名图象图形领域的学术界和产业界专家在会上共同探讨图象图形学术研究与技术创新趋势。阿里巴巴智能信息事业群夸克App专家彭家德在主题演讲中分享夸克扫描王如何用高质量数据提高多模态识别可靠性,聚焦“产学研用”的应用环节,探讨分享了企业如何用技术解决实际应用问题。

阿里巴巴智能信息事业群夸克App算法专家彭家德与参会专家分享探讨

彭家德在演讲中提出,虽然多模态模型设计在技术领域至关重要,但在企业应用中数据构建的策略和质量则是决定成败的关键。原因是数据的准确性决定了产品的可靠性。为提高数据准确性,夸克扫描王采用了自动化标注和数据合成两种方法来生成高质量数据,有效提升了多模态识别的准确性和效率。

自动化标注通过预训练的基础模型对新数据进行初步识别,再经过复杂的筛选和模型过滤,从而得到准确率较高的数据。这一过程不仅提高了数据的丰富度,还补充了语料库的不足。数据合成技术则针对场景中各种样式的文字,通过复杂的算法和规则合成各种样式,使得合成的样式在肉眼上与真实图片无差异,从而解决了复杂场景下的数据难题。

彭家德提出,通过这两种方法夸克扫描王已经生成了10亿级别的文本行数据以及千万级别的公式数据。基于此,夸克扫描王手写字符识别准确率已达到99.5%以上。在公式识别、复杂排版(分段)识别、复杂排版(缩进)等扫描难度较高的复杂场景中,根据《国家移动互联网软件产品质量检验检测中心》的评测报告显示,夸克扫描王识别准确率分别拿到了86.92%、99.72%和93.73%的高分,大幅领先行业平均水平。

因此夸克扫描王也获得了家长和教师的青睐。例如家长们用夸克扫描王手写识别功能,将孩子作文提取成电子版输入到大语言模型里做语义判断,帮助他们发现语言上和书写上的表达问题。也有老师用夸克扫描王提取纸质试卷上带公式的题目来不断丰富题库,再从题库里筛选题目去拼成一张新的试卷。

在实际应用中,这些识别技术还被应用在淘宝、盒马的合同识别、商品自动化上架中。例如在淘宝和盒马上每天都有非常多的新商品上架,通过识别技术识别和结构化分析商品的文字信息,就可以实现商品的自动上架。

对于未来的技术展望,彭家德认为,尽管人工智能技术在处理多模态内容理解方面取得了显著进展,但未来的技术发展仍依赖于更大规模知识库的构建与模型能力的提升。他认为,大型语言模型的能力将越来越强,支持的输入长度也会越来越长,但其能力总归是有上限,核心还是首先要构建一个高质量的数据库,才能为用户做出一个可靠可信赖的应用。

声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1