买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京理工大学唐山研究院;北京理工大学
摘要:本发明提供基于大语言模型和知识图谱的中医药问答系统构建方法,从预处理阶段就严格筛选和优化输入问题;通过自然语言处理模块注入领域专业知识,利用大语言模型和知识库完成初步回答的生成;在知识图谱模块中实现对已有知识的检索与新推理知识的补全;最后,模型融合模块通过抽取转化机制将大语言模型与知识图谱紧密衔接,形成了一个双向交互和信息共享的闭环系统,本发明整个问答系统通过精心设计的模块化架构和有效的模型融合技术,不仅提升了模型在专业问答任务上的性能,而且增强了模型对中医药领域知识的掌握和表达能力,为用户提供高质量的中医药专业问答服务。
主权项:1.一种基于大语言模型和知识图谱的中医药问答系统构建方法,其特征在于,第一步,基于大语言模型搭建问答系统构架,其包括预处理模块、自然语言处理模块、知识图谱模块和模型融合模块,其中,预处理模块负责对问题文本进行信息过滤,通过文本分类模型判断问题是否与中医药领域相关;自然语言处理模块被定义为用于完成自然语言与机器语言的转换,生成易读的专业答案;知识图谱模块负责对知识进行有效存储和检索,用于对大语言模型输出的答案进行补全;模型融合模块被定义为用于将预处理模块、自然语言处理模块和知识图谱模块进行集成,形成统一的问答模型,完成内部调用;第二步,获取中医药知识,构建中医药领域知识库,将中医药领域知识库的知识输入自然语言处理模块,将数据进行处理,生成向量数据库;第三步,输入问题文本,利用自然语言处理模块对问题文本进行处理,利用文本分类模型对问题文本进行过滤,判断其是否为中医药领域相关问题,并进行分类标记;第三步,若问题文本的分类标记为不相关,则直接调用大语言模型,利用其本身的知识和理解能力生成相应的回答;若问题文本的分类标记为相关,则根据问题文本对向量数据库进行文本检索,将问题文本与检索到的文本段内容输入给大语言模型,由大语言模型得到初始回答;第四步,建立知识图谱,具体为先建立中医药方剂数据集,从中医药方剂数据集中抽取满足条件的三元组知识,将这些知识注入图知识库中,从而构建知识图谱;第五步,模型融合模块提取初始回答文本,利用大语言模型抽取初始回答文本中的三元组集合;根据问题文本抽取的三元组集合,模型融合模块在知识图谱中检索相关节点并提取相关子图结构集合,获取到图数据库中与初始回答文本相关的图谱知识;第六步,将初始回答和补充答案一并作为上下文,与问题文本一起填入prompt模板中完成三元组结构的易读化处理,引导大语言模型整合并输出最终的专业性回答。
全文数据:
权利要求:
百度查询: 北京理工大学唐山研究院 北京理工大学 基于大语言模型和知识图谱的中医药问答系统构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。