首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于协同增强的词项级查询扩展方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:大连理工大学

摘要:本发明提供了一种基于协同增强的词项级查询扩展方法,属于信息技术和人工智能领域。本发明通过使用零样本提示的生成式与检索式方式获得语义信息更为丰富的协同增强的相关反馈,并基于同样的协同增强方式获得与查询更为相关的查询扩展词;本发明证明这些词语作为查询扩展词的有效性,并且与仅伪相关文档的方法相比较,本发明获得的查询扩展词更为丰富与多样;在获得高质量的查询扩展词列表后,开发了一种基于通义千问大语言模型的扩展词排序模型来对查询扩展词列表进行精排获得相关性排名更为精确的查询扩展词列表,从而用于信息检索流水线中查询端的查询扩展框架中,显著提升了检索算法的性能。

主权项:1.一种基于协同增强的词项级查询扩展方法,其特征在于,该方法包括以下步骤:S1、通过初步检索获取伪相关反馈文档集;输入一个原始查询,在语料库中对进行初步检索,获得个相关文档,组成伪相关反馈文档集,其中为伪相关反馈文档的数量;S2、通过大语言模型获取生成式相关反馈文档集;对于原始查询,通过LoRA微调训练大语言模型获取生成式相关反馈文档集,其中表示生成式相关反馈文档集中文档的数目;S3、将S1中获得的与S2中获得的拼接得到协同增强相关反馈,其中;S4、获取协同增强扩展词;对于中的每一个文档,分别通过外部向量知识库获取检索式查询扩展词,通过LoRA微调大语言模型获取生成式扩展词,所述检索式查询扩展词与所述生成式扩展词共同构成协同增强扩展词;其中;S5、利用大语言模型进行扩展词排序;训练得到基于通义千问大语言模型的扩展词排序模型,通过生成式的方式获取所述协同增强扩展词与原始查询的相关性分数;通过滑动排序窗口的方式对所述协同增强扩展词进行重排序,选取前P个扩展词作为查询扩展结果。

全文数据:

权利要求:

百度查询: 大连理工大学 基于协同增强的词项级查询扩展方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。