天眼查App显示,2025年5月13日,「基于轻量级样本数据的文本分类方法及装置」正式进入专利公布阶段。申请人为中国邮政储蓄银行股份有限公司,该项人工智能专利涉及基于轻量级样本数据的文本分类技术领域。据专利信息显示,该技术能够显著优化传统文本分类模型训练过程中对大量数据的需求问题,有效降低训练成本。发明人为胡敏、赵文煜、刘震、李天翼和闫志强。
本发明公开了一种基于轻量级样本数据的文本分类方法及装置。具体而言,该方法包括:在接收到待分类文本的情况下,按照语义对待分类文本进行分割,得到多个词向量;对至少两个相邻的词向量依次进行局部特征关联分析,得到待分类文本的多个局部特征;根据所有词向量之间的语义关联对每个词向量进行全局特征关联分析,得到与每个词向量对应的全局特征;将多个局部特征和多个全局特征输入至文本分类模型中进行处理,得到待分类文本的文本类型。通过上述方式,本发明解决了相关技术中传统的文本分类模型在训练时需要收集大量训练数据并人工标记标签的问题,从而大幅降低训练成本并提升效率。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。