首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于预训练语言模型的可视化专利检索方法_数据空间研究院_202410348493.1 

申请/专利权人:数据空间研究院

申请日:2024-03-26

公开(公告)日:2024-06-14

公开(公告)号:CN118193726A

主分类号:G06F16/34

分类号:G06F16/34;G06F16/35;G06F40/216;G06F40/279

优先权:

专利状态码:在审-公开

法律状态:2024.06.14#公开

摘要:本发明涉及自然语言处理技术领域,具体是一种基于预训练语言模型的可视化专利检索方法,本发明在专利关键词检索场景下,基于预训练语言模型对专利文本进行关键词的抽取和词向量表示,并对检索返回的专利特征降维,以散点图的形式可视化展示检索结果,相比于列表形式展示的检索结果,更加直观,并且提供了专利之间相似程度、专利分簇情况等更加丰富的检索信息。

主权项:1.一种基于预训练语言模型的可视化专利检索方法,其特征在于,包括以下检索步骤:S1、使用已有关键词标注的专利文本,训练一个RoBERTa+Bi-LSTM模型,用于从专利文本中抽取关键词;S2、将专利数据库中的专利文本,按指定格式输入S1中训练好的RoBERTa+Bi-LSTM模型,抽取多个关键词以及这些关键词的词向量,多个词向量相加,作为该专利文本的高维向量表示;S3、将待检索的多个关键词,按指定格式输入S1中的RoBERTa模型,获取关键词的词向量,多个关键词的向量则相加,作为该查询文本的高维向量表示;S4、依次计算S3中的查询文本向量与专利库中所有专利文本经过S2处理后的高维向量之间的余弦相似度;选取余弦相似度小于设定阈值的专利文本作为检索候选结果;S5、对S3中的查询文本向量和S4中获取的检索候选专利的文本向量,输入流型降维模型Barnes-Hutt-SNE进行降维,均降至2维;S6、对降维后的查询文本向量和候选专利文本向量以点的形式呈现在二维平面中,形成散点图,通过散点图中点与点之间的距离可视化的表示检索结果之间的相似度关系。

全文数据:

权利要求:

百度查询: 数据空间研究院 一种基于预训练语言模型的可视化专利检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。