买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学院大学
摘要:本发明公开了一种开放域问答任务中的查询扩展优化方法及查询方法。本发明的查询扩展优化方法采用分析、生成和精炼的三步渐进式提示策略,利用LLMs的多任务能力,促进开放域的查询扩展生成;1分析阶段利用LLMs的语义分析能力生成分析;2生成阶段利用LLMs的知识检索和整合能力生成多样的答案导向查询扩展作为候选者,用于检索参考文本,以筛选出错误和不相关的生成信息,生成更接近潜在答案的新候选者;3为了对查询扩展进行质量控制,精炼阶段利用LLMs的上下文理解和推理能力对所有候选者进行自我审查以生成优化后的查询扩展。本发明能够有效地在跨领域场景下进行高质量的查询扩展生成,确保了信息检索的准确性和相关性。
主权项:1.一种开放域问答任务中的查询扩展优化方法,其步骤包括:1以提取关键词为目标的提示模板prompt引导大型语言模型LLMs从原始查询q中提取关键短语,得到一关键短语集合K;基于所述关键短语集合K填充所述大型语言模型LLMs的以分析查询为目标的提示模板prompt,并将填充后的提示模板prompt输入所述大型语言模型LLMs对原始查询q进行问题分析,获得分析文本A;2以生成潜在答案作为查询扩展为目标的提示模板prompt引导所述大型语言模型LLMs根据所述分析文本A生成多个以查询答案为导向的查询扩展Qe={qe1,qe2,…,qen},qen为第n个以查询答案为导向的查询扩展;然后对每一所述查询扩展qei进行召回,获取语料库对应的多个文档作为所述查询扩展qei的参考文档集合Dqei,对各查询扩展的参考文档集合进行汇总得到上下文参考集合CRs;然后将上下文参考集合CRs与原始查询q一同输入所述大型语言模型LLMs,使用以融合参考文档集合生成潜在答案作为查询扩展为目标的提示模板prompt引导所述大型语言模型LLMs生成新的多个以查询答案为导向的候选查询扩展Qe={qe1,qe2,…,qen};qen为第n个以查询答案为导向的候选查询扩展;3使用以消除查询扩展候选集中不相关或错误信息为目标的提示模板prompt利用所述大型语言模型LLMs在上下文理解和推理方面的能力,对候选查询扩展Qe={qe1,qe2,…,qen}进行审查,得到优化的查询扩展qeo并将其附加到原始查询q上,得到原始查询q优化后的查询扩展。
全文数据:
权利要求:
百度查询: 中国科学院大学 一种开放域问答任务中的查询扩展优化方法及查询方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。