北京字跳网络技术有限公司文本聚类方法专利公布(计算专利快讯)

天眼查App显示,2025年7月15日,《一种文本聚类方法、装置、设备、介质及程序产品》正式进入专利的公布阶段。申请人为北京字跳网络技术有限公司,该项计算专利涉及文本聚类技术在信息处理与数据分析中的应用。据专利信息显示,该技术通过预设分类模型筛选特定类别文本并构建关键词网络,从而提升聚类效率与准确度,实现对相似内容更优的归类效果,取得突破性进展。发明人为程乾、纪忠光。该专利摘要指出:本公开实施例提供了一种文本聚类方法、装置、设备、介质及程序产品。该方法包括:将第一文本集合输入预设分类模型,基于预设分类模型确定第一文本集合中的第二文本集合,第二文本集合是预设类别的文本的集合。根据第二文本集合中的关键词构建关键词网络,根据关键词网络生成多个关键词序列,基于多个关键词序列确定第二文本集合中文本的文本向量,基于文本向量进行文本聚类。本公开实施例是通过预设分类模型从第一文本集合中筛选出预设类别的第二文本集合,基于第二文本集合中文本的关键词对文本进行聚类,可以减少待聚类文本,提高聚类效率,还可以减少无关信息的干扰,提高聚类的准确度,实现更好的将相似内容聚类到同一簇内,优化了聚类效果。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新文章
Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1