首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种融合知识图谱、知识库和大型语言模型的问答系统构建方法_珠江水利委员会珠江水利科学研究院;广西大藤峡水利枢纽开发有限责任公司_202311821070.9 

申请/专利权人:珠江水利委员会珠江水利科学研究院;广西大藤峡水利枢纽开发有限责任公司

申请日:2023-12-27

公开(公告)日:2024-06-14

公开(公告)号:CN117688189B

主分类号:G06F16/36

分类号:G06F16/36;G06F40/194;G06F16/31;G06F16/332;G06F16/35

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2024.03.29#实质审查的生效;2024.03.12#公开

摘要:本发明公开了一种融合知识图谱、知识库和大型语言模型的问答系统构建方法,属于自然语言处理技术领域,本发明中,提供了一套完善的问答系统构建方法。针对水利行业的数据特点,从多个维度对问答系统进行定制,给出了一套完善的问答系统构建方法,包括模型选择,训练策略和数据集构建方式等。本发明采用pipeline方式组合自然语言处理模型构建了一套完善的问句处理架构,所需数据集均从目标知识图谱中构建而来,无需大量的人工标注。该架构不仅确保了知识图谱问答系统的准确性和全面性,同时将知识库、知识图谱和大语言模型相互耦合,实现了它们之间的优势互补,改善了用户的使用体验。

主权项:1.一种融合知识图谱、知识库和大型语言模型的问答系统构建方法,其特征在于:所述问答系统构建方法包括以下步骤:S1:获取用户输入问句,使用深度学习模型抽取问答系统问题中存在的所有实体提及;S2:使用候选链接实体排序算法,在指定知识图谱中为每个实体提及寻找潜在的链接实体;S3:使用预先设置的问句模板集合,对用户提出的问题进行问句分类,根据分类结果选择性地返回知识图谱答案、大语言模型答案或知识库答案;步骤S2中,具体步骤如下:S2.1:遍历查找知识图谱中所有的实体,组成候选链接实体列表,使用Faiss向量库存储该列表,文本向量化模型选择m3e-base模型;S2.2:针对每个实体提及,使用Faiss向量库按照L2相似度检索最相关的Top-5个实体作为候选链接实体Esim,并得到归一化的相似性值作为向量相似性得分Ssim;S2.3:针对Esim中的每个候选链接实体,计算候选链接实体的流行度得分,具体计算公式为: 其中:in-dege是实体e的出度和入度之和,而α是一个超参数;S2.4:检索得分为向量相似性得分与候选链接实体流行度得分之和,即: 根据检索得分,重新排序候选链接实体Esim,得到每个实体提及的最相关实体,完成实体链接;步骤S3中,使用预先设置的问句模板集合,对用户提出的问题进行问句分类,根据分类结果选择性地返回知识图谱答案、大语言模型答案或知识库答案的过程中需要使用深度学习模型,使用深度学习模型的过程中包括模型训练和模型预测,其中模型预测的步骤包括:S3.3:根据用户输入的问题以及得到的候选链接实体,使用问句分类模型进一步分类,得到问题所属的类别,再对应返回知识图谱答案,大模型答案或知识库答案;具体描述如下:S3.3.1:知识图谱答案:将链接实体结构化映射后,调用Cypher查询语句进行查询和推理,返回特定实体或路径,作为知识图谱答案;S3.3.2:大模型答案:将问题和链接实体的属性信息组建成Prompt,进一步将该Prompt输入到大模型,得到大模型答案;其中,大模型使用开放API,或者本地化私有部署;S3.3.3:知识库答案:知识库答案包含大模型的总结性结果,还有问题相关背景知识以及背景知识出处;具体包含以下三个步骤:S3.3.3.1:基于Python的docx库或者pdfplumber库将本地文件拆分成私有知识库,最后按照换行符\n拆分文档,组成知识库;S3.3.3.2:使用Faiss结合文本嵌入模型m3e-base,根据用户输入问题检索知识库中的知识作为背景知识,同时记录知识来源文件;S3.3.3.3:将用户输入问题和知识库背景知识组成Prompt,进一步将该Prompt输入到大模型,得到大模型的总结性答案,作为知识库答案;使用的大模型和S3.3.2步骤一致。

全文数据:

权利要求:

百度查询: 珠江水利委员会珠江水利科学研究院;广西大藤峡水利枢纽开发有限责任公司 一种融合知识图谱、知识库和大型语言模型的问答系统构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。