【发明公布】一种基于预训练语言模型的可视化专利检索方法_数据空间研究院_202410348493.1

导航：龙图腾网> 最新专利技术> 一种基于预训练语言模型的可视化专利检索方法_数据空间研究院_202410348493.1

申请/专利权人：数据空间研究院

申请日：2024-03-26

公开（公告）日：2024-06-14

公开（公告）号：CN118193726A

主分类号：G06F16/34

分类号：G06F16/34;G06F16/35;G06F40/216;G06F40/279

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明涉及自然语言处理技术领域，具体是一种基于预训练语言模型的可视化专利检索方法，本发明在专利关键词检索场景下，基于预训练语言模型对专利文本进行关键词的抽取和词向量表示，并对检索返回的专利特征降维，以散点图的形式可视化展示检索结果，相比于列表形式展示的检索结果，更加直观，并且提供了专利之间相似程度、专利分簇情况等更加丰富的检索信息。

主权项：1.一种基于预训练语言模型的可视化专利检索方法，其特征在于，包括以下检索步骤：S1、使用已有关键词标注的专利文本，训练一个RoBERTa+Bi-LSTM模型，用于从专利文本中抽取关键词；S2、将专利数据库中的专利文本，按指定格式输入S1中训练好的RoBERTa+Bi-LSTM模型，抽取多个关键词以及这些关键词的词向量，多个词向量相加，作为该专利文本的高维向量表示；S3、将待检索的多个关键词，按指定格式输入S1中的RoBERTa模型，获取关键词的词向量，多个关键词的向量则相加，作为该查询文本的高维向量表示；S4、依次计算S3中的查询文本向量与专利库中所有专利文本经过S2处理后的高维向量之间的余弦相似度；选取余弦相似度小于设定阈值的专利文本作为检索候选结果；S5、对S3中的查询文本向量和S4中获取的检索候选专利的文本向量，输入流型降维模型Barnes-Hutt-SNE进行降维，均降至2维；S6、对降维后的查询文本向量和候选专利文本向量以点的形式呈现在二维平面中，形成散点图，通过散点图中点与点之间的距离可视化的表示检索结果之间的相似度关系。

全文数据：

权利要求：

百度查询：数据空间研究院一种基于预训练语言模型的可视化专利检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：光学系统和包括该光学系统的相机模块_LG伊诺特有限公司_202280073239.4

下一篇：一种倾斜电路板焊点视觉反馈高精度点触方法_清华大学天津高端装备研究院_202410068626.X

相关技术

光学系统和包括该光学系统的相机模块_LG伊诺特有限公司_202280073239.4

一种倾斜电路板焊点视觉反馈高精度点触方法_清华大学天津高端装备研究院_202410068626.X

无线通信方法及系统_杭州九阳小家电有限公司_202211640089.9

一种电解水制氢异质结催化剂的制备及其应用_昆明理工大学_202410334678.7

升降销硬止动件_朗姆研究公司_202280073752.3

图像解码方法及其装置_LG电子株式会社_202280076929.5

一种ORB特征匹配融合AMCL的机器人重定位方法_重庆邮电大学_202410163891.6

一种基于双蒸发器的紧凑式压缩制冷散热系统及应用_苏州华旃航天电器有限公司_202410334871.0

基于多模块组合的应用程序越权漏洞检测方法及系统_深圳开源互联网安全技术有限公司_202410023783.9

由独立组分生产的果仁酱仿品_航行食品股份有限公司_202280059657.8

用于处理车辆的路径选择的方法和系统_沃尔沃卡车集团_202311739282.2

一种模拟母乳油脂组合物及其制备方法与应用_杭州岛屿星晴生物技术有限公司_202410349373.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于预训练语言模型的可视化专利检索方法_数据空间研究院_202410348493.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务