【发明授权】一种基于检索生成联合式训练的专利查询方法及系统_北京知呱呱科技有限公司;知呱呱(天津)大数据技术有限公司_202410417485.8

申请/专利权人：北京知呱呱科技有限公司;知呱呱(天津)大数据技术有限公司

申请日：2024-04-09

公开（公告）日：2024-06-18

公开（公告）号：CN118013020B

主分类号：G06F16/332

分类号：G06F16/332;G06F16/33;G06F40/284;G06Q50/18

优先权：

专利状态码：有效-授权

法律状态：2024.06.18#授权;2024.05.28#实质审查的生效;2024.05.10#公开

摘要：本申请公开了一种基于检索生成联合式训练的专利查询方法及系统，方法包括首先利用问题生成模型分析用户的初始查询，并生成一系列细化且关联度高的查询问题；随后，文档检索模型根据这些精心构造的查询问题对专利数据库进行检索，返回按相关性排列的专利文档列表；在此基础上，通过对检索结果的综合分析，特别是通过识别出的潜在硬负样本，自动分析正负样本的区别技术特征，进而能够动态调整和优化问题生成模型，以生成具有更高区分能力的查询问题，从而进一步提高检索的准确率。

主权项：1.一种基于检索生成联合式训练的专利查询方法，其特征在于，所述方法包括：获取用户输入的初始查询数据，将所述初始查询数据输入至问题生成模型进行处理得到第一问题文本，基于所述第一问题文本通过文档检索模型进行检索处理得到待选文档集合；将所述待选文档集合输入至问题生成模型进行处理得到第二问题文本集合，并在所述第二问题文本集合中确定出目标问题；在所述待选文档集合中将目标问题所对应的文档作为正例样本，其他文档作为硬负样本对文档检索模型进行训练，利用训练完成的文档检索模型获取初始查询数据所对应的专利查询结果；在将所述待选文档集合输入至问题生成模型进行处理得到第二问题文本集合之前，所述方法还包括：获取问题生成模型的训练数据；其中，所述训练数据包括人工标注的文档问题对，每对数据包括一个专利文档的说明书及一个或多个与该文档内容相关的查询问题；通过获取的训练数据对问题生成模型进行训练，使用交叉熵损失来衡量模型生成问题与标签问题之间的差异，其中，损失函数具体为：， L rel 表示相关性损失，N表示训练集中的总样本数，i表示第i个样本，Ti表示第i个样本中问题的词汇总数，t表示第i个问题中的第t个词，yi,t表示第i个问题中第t个词的实际分布，表示模型预测的第i个问题中第t个词的概率分布，表示对模型预测的概率分布取对数；在所述待选文档集合中将目标问题所对应的文档作为正例样本，其他文档作为硬负样本对文档检索模型进行训练，还包括：对数据集中每个样本对，首先利用文档检索模型对全部专利文档进行向量建模，然后进行一轮标准检索，以识别出与每个查询问题相关但实际上并不满足查询意图的硬负样本文档集合；其中，硬负样本识别的公式包括：，表示对于给定的查询问题q，识别出的硬负样本集合；是待选负样本；表示查询问题q与文档之间的相似度；是预设的阈值，用于区分硬负样本；表示与查询问题相关的正样本。

全文数据：

权利要求：

百度查询：北京知呱呱科技有限公司;知呱呱(天津)大数据技术有限公司一种基于检索生成联合式训练的专利查询方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于生物技术的实验室用空气过滤装置_汇智赢华医疗科技研发(北京)有限公司_202410305488.2

下一篇：用于提供更新的机器学习算法的系统和方法_西门子医疗有限公司_202311623232.8

相关技术

一种基于生物技术的实验室用空气过滤装置_汇智赢华医疗科技研发(北京)有限公司_202410305488.2

用于提供更新的机器学习算法的系统和方法_西门子医疗有限公司_202311623232.8

密钥协商方法、装置、相关设备和计算机程序产品_中国电信股份有限公司_202410642634.0

一种自润滑长寿命硬质合金串珠及其制备方法和应用_郑州机械研究所有限公司_202311466192.0

显示装置和用于制造该显示装置的方法_三星显示有限公司_202311264824.5

密封结构、储能柜以及储能系统_比亚迪股份有限公司_202311864539.7

升降销硬止动件_朗姆研究公司_202280073752.3

一种电解水制氢异质结催化剂的制备及其应用_昆明理工大学_202410334678.7

可交联聚烯烃组合物_SABIC环球技术有限责任公司_202280072879.3

具有顶部抗压结构的高低压变频器_西安启功电气有限公司_202211648198.5

一种倾斜电路板焊点视觉反馈高精度点触方法_清华大学天津高端装备研究院_202410068626.X

催化剂质子膜涂层及其制备方法、以及膜电极、燃料电池_武汉氢能与燃料电池产业技术研究院有限公司_202410642734.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于检索生成联合式训练的专利查询方法及系统_北京知呱呱科技有限公司;知呱呱(天津)大数据技术有限公司_202410417485.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务