买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西北大学
摘要:本发明公开了一种基于蕴含树形式的文本知识多跳问答方法,通过融合Query‑as‑context的密集检索模型来检索与问答相关的语料;用强化学习的方式对句子选择器进行训练,将检索得到的语料送入句子选择器对语料进行选择并生成中间结论;通过Long‑T5预训练模型的推理生成器完成多跳问答中的每一步,即单步生成中间结论,直到完成多跳问答的任务;本发明的提高了推理的准确性和鲁棒性,并组织成蕴含树的形式此方法解决了多跳问答领域中的可解释性的问题,在多跳问答领域使用Long‑T5模型,更高质量更准确的完成了多跳问答任务。
主权项:1.基于蕴含树形式的文本知识多跳问答方法,其特征在于包括如下步骤:步骤S1:通过融合Query-as-context的密集检索模型来检索与问答相关的语料;通过预训练编码器将文本语料库中的语料转换为密集向量,通过计算向量之间的余弦相似度来检索得到多跳问答所需语料;步骤S2:用强化学习的方式对句子选择器进行训练,将检索得到的语料送入句子选择器对语料进行选择并生成中间结论;步骤S21:设Sk表示当前句子集合,Ak表示当前的动作集合,表示在句子集合sk状态下的动作概率密度函数,根据概率密度函数选择语句;步骤S22:将一个选择动作表示为sk,ak,ck,表示在状态sk采取动作ak并生成中间结论ck,经过多次句子选择和推导生成的迭代后,获得一条轨迹推理路径T={s1,a1,c1,s2,a2,c2,…,sK,aK,cK},表示为构建蕴含树所采取的推理步骤;步骤S23:根据推理路径T={s1,a1,i1,s2,a2,i2,…,sK,aK,iK},设计奖励函数; 表示根据推理路径计算所得的累计奖励; 表示在第k步时的奖励值,γ是折扣因子,γ一般设置为小于1的值,用以增强当前步骤所得到的奖励的重要性; rk是一个判断函数,判断在当前状态sk下所作出的动作ak与得到的中间结论ck是否正确;步骤S24:为得到最好的推理路径,需要最大化累计奖励函数由于推理路径的生成依赖于函数具有随机性,取最大化累计奖励函数的期望取样N条推理路径进行近似,Kn是轨迹Tn的长度,表示在Tn中第k步的状态、动作以及生成的中间结论;生成中间结论;步骤S3:通过Long-T5预训练模型的推理生成器完成多跳问答中的每一步,即单步生成中间结论,直到完成多跳问答的任务。
全文数据:
权利要求:
百度查询: 西北大学 基于蕴含树形式的文本知识多跳问答方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。