西安长天长软件股份有限公司一种环保领域文本词向量化方法及相关系统专利公布(自然语言处理专利快讯)

天眼查App显示,2025年5月13日,「一种环保领域文本词向量化方法及相关系统」正式进入专利的公布阶段。申请人为西安长天长软件股份有限公司,该项自然语言处理专利涉及环保领域文本数据的高效语义提取与向量化技术。据专利信息显示,通过使用GLOVE模型和M3E模型综合进行词向量化,提供了更丰富的语义信息,能够显著优化单词间的统计关系捕捉及不同语境下的细微差别识别。发明人为曹翔、李茂鹏、刘坤、陈黎明、赵若雨。「本发明提供了一种环保领域文本词向量化方法及相关系统,属于自然语言处理领域。包括如下步骤:获取环保领域文本数据并建立词汇库;基于建立的词汇库构建共现列表,利用动态权重函数计算共现列表中每个单词对的权重值,通过GLOVE模型对权重值高的单词对进行词向量化,生成初始的词向量;基于生成的初始的词向量训练M3E模型,通过In‑batch负采样对比学习和跨模态损失函数联合优化M3E模型,对M3E模型进行优化训练;将文本数据输入训练好的M3E模型,生成文本词向量。」

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1