买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于知识图谱的柑橘管控问答模块构建方法及问答系统_华南农业大学_202111387891.7 

申请/专利权人:华南农业大学

申请日:2021-11-22

公开(公告)日:2024-04-16

公开(公告)号:CN114036281B

主分类号:G06F16/332

分类号:G06F16/332;G06F16/33;G06F16/335;G06F16/35;G06F16/36;G06F40/194;G06F40/242;G06F40/295

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.03.01#实质审查的生效;2022.02.11#公开

摘要:本发明涉及的技术领域,更具体地,涉及一种基于知识图谱的柑橘管控问答模块构建方法及问答系统,通过构建知识图谱、问答对数据库、柑橘问题文本分类语料库、分词词典、谓词词典和谓词索引词典,对命名实体识别模型、候选词集合排序模型、文本匹配模型和路径排序模型进行训练,构建用于柑橘种植管理的问答模块,可自动化理解用户的问题语句,筛选候选词集合到知识图谱生成候选路径,对候选路径进行打分排序后,快速准确地获得答案,帮助高效获取有价值的信息,解决用户在种植柑橘时的问题。

主权项:1.一种基于知识图谱的柑橘管控问答模块构建方法,其特征在于,包括以下步骤:S1:构建柑橘种植管理的知识图谱和问答对数据库,并根据问答对数据库中的问题语句构建柑橘问题文本分类语料库;S2:根据知识图谱构建分词词典、谓词词典,并根据谓词词典构建谓词索引词典;S3:根据问答对数据库中的问题语句,构建命名实体识别模型;S4:根据命名实体识别模型与分词词典,并对问题语句进行处理,获得包含若干候选词的候选词集合,将若干候选词链接到知识图谱,并为每个候选词生成特征,训练候选词集合排序模型,对候选词集合进行筛选;S5:根据柑橘问题文本分类语料库,微调预训练的Bert文本匹配模型,生成文本匹配模型;S6:获取筛选后的候选词集合在知识图谱内直接相连的所有路径,并生成为人工问题,将所有生成的人工问题与问题语句输入文本匹配模型,为每个路径打分,将路径分数与候选词集合在筛选过程中生成的特征拼接成路径的新特征,训练路径排序模型;步骤S1中,问答对数据库包含若干问答对数据,每条所述问答对数据包含三行数据,第一行为柑橘精准管控中用户可能出现的问题语句,第二行为所述问题语句在知识图谱中检索对应答案所使用的查询语句,第三行为在知识图谱中检索后得到的答案,每条问答对数据之间以空行隔开;步骤S3中,构建命名实体识别模型的方法为:反向标注问答对数据库中的问题语句,生成训练数据,采用Bert-BiLstm模型来进行命名实体识别,将问题字符串与对应的实体字符串的最长公共子序列标注为问题语句的命名实体部分,由分词器Tokenizer生成问题的词索引序列x1及分块索引序列x2,将x1、x2输入命名实体识别模型,问题字符串与对应实体字符串的最长公共子序列部分标签为1,其余为0,生成对应的命名实体识别模型标签序列y=y1,y2,y3,……,yN,N为最大字符;根据命名实体识别模型交叉熵建立命名实体识别模型损失函数: py=py1,py2,py3,……,pyN式中,H1Pq1为命名实体识别模型交叉熵,py为命名实体预测序列,pyi为第i个词为实体的概率;对命名实体识别模型进行迭代训练,使H1Pq1最小,根据训练好的命名实体识别模型计算py,预设阈值为0.5,当pyi≥0.5时,输出为1;当pyi0.5时,输出为0;保存训练好的命名实体识别模型;步骤S6中,为路径打分的过程为:将所有生成的人工问题与问题语句输入文本匹配模型,将对应问题语句的人工问题标注为1,反之为0,生成文本匹配模型标签θ=θ1,θ2,θ3,……,θn,n为人工问题数量;根据文本匹配模型交叉熵建立文本匹配模型损失函数: 式中,H3Pq为文本匹配模型交叉熵;pθi为第i个人工问题与问题语句的相似度,即第i条路径的路径分数;保存训练好的文本匹配模型;路径排序模型的训练过程为:将路径分数与候选词集合在筛选过程中生成的特征拼接成路径的新特征,输入路径排序模型,判断路径是否为正确路径,若是,将对应路径标注为1,反之为0,生成路径排序模型标签n为路径数量;根据路径排序模型交叉熵建立路径排序模型损失函数: 式中,H4Pq为路径排序模型交叉熵;为第i个路径正确的概率;保存训练好的路径排序模型。

全文数据:

权利要求:

百度查询: 华南农业大学 基于知识图谱的柑橘管控问答模块构建方法及问答系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。