首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Word2vec-QCNN模型的文本表示系统、方法及其在电力领域词库构建的应用 

申请/专利权人:湖南大学

申请日:2024-02-29

公开(公告)日:2024-05-14

公开(公告)号:CN118036605A

主分类号:G06F40/289

分类号:G06F40/289;G06F40/284;G06F16/33;G06F16/35;G06F18/213;G06F18/23;G06N3/0464;G06N3/08;G06N3/006;G06N10/20

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.31#实质审查的生效;2024.05.14#公开

摘要:本发明公开了一种基于Word2vec‑QCNN模型的文本表示系统、方法及其在电力领域词库构建的应用,该方法预处理模块对电力文本进行分词并去停用词;向量转换模块采用Word2vec模型将所得词汇转化为词向量;特征提取模块采用振幅编码将词向量编码为量子态,利用QCNN模型对量子态的词向量进行卷积完成特征提取,并池化降维,去除冗余特征,通过量子测量将处理后的量子态投影到新的经典空间,得到三维词向量;聚类模块采用QPSO算法对三维词向量聚类;词集对比模块将聚类所得词集与非专业词集对比,剔除重叠词,获得最终电力领域词库。本发明利用量子计算的并行性优势和量子叠加态特性提高计算效率及模型表达能力,从而提高词库准确率。

主权项:1.一种基于Word2vec-QCNN模型的文本表示系统,其特征在于,包括:文本预处理模块、向量转换模块、特征提取模块、聚类模块和词集对比模块;文本预处理模块,用于对文本进行分词和去停用,剔除待表示文本中无意义信息;向量转换模块包括第一训练单元和Word2vec模型,通过第一训练单元对Word2vec模型进行训练,采用训练后的Word2vec模型将预处理后的单词分别均映射到隐藏层表示空间中,得到预处理后的单词对应的词向量;特征提取模块包括第二训练单元、QCNN模型和编码单元,通过第二训练单元对QCNN模型进行训练,通过编码单元采用振幅编码的方式将词向量编码为量子态,利用训练好的QCNN模型对量子态的词向量进行卷积完成特征提取,并对所提取的特征进行池化完成降维,去除冗余特征,对降维后的特征进行量子测量,将量子态投影到新的经典空间,得到三维词向量。

全文数据:

权利要求:

百度查询: 湖南大学 一种基于Word2vec-QCNN模型的文本表示系统、方法及其在电力领域词库构建的应用

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。