买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:国网浙江省电力有限公司电力科学研究院;华北电力大学
摘要:本发明公开了一种用于户外变电站的智能问答方法及置于户外的机器人,属于户外机器人技术领域。本发明针对变电设备故障处理问题,提供一种用于户外变电站的智能问答机器人,通过构建知识库模块、智能问答模块,并利用实体识别BERT+FLAT模型,抽取自然语言问句中的设备实体元素,并对自然语言问句进行槽填充,进而能有效提升了机器基于变电设备故障案例文本信息的问答准确率,降低了问答机器人的响应延迟,能够根据基层人员提问人不同描述形式的提问需求,快速准确地判断并能反馈给基层人员变电设备的故障部位、故障原因、建议措施等有效内容,从而改善了一个问句中包含多个实体或关系的复杂性问题,加快站内设备故障处理进度。
主权项:1.一种用于户外变电站的智能问答方法,其特征在于,包括以下步骤:第一步,接收外部输入的自然语言问句;第二步,对第一步中的自然语言问句进行意图识别,分析提问人员的问询意图,并按照故障部位问询、故障原因问询、建议措施问询进行分类;第三步,根据第二步中的意图识别结果,构建实体识别BERT+FLAT模型,抽取自然语言问句中的设备实体元素,并对自然语言问句进行槽填充;所述实体识别BERT+FLAT模型,基于字符融入词汇信息的方法,进行设备实体元素的初步抽取,得到初步实体抽取结果;对初步实体抽取结果进行去重、筛选后构建实体拼音同指库;再将实体拼音同指库转换为带有声调的汉字拼音数据;根据汉字拼音数据匹配得到最终的实体抽取结果;同时根据自然语言问句的相对位置编码信息,填补自然语言问句的绝对位置编码信息的空白,实现自然语言问句的槽填充;所述设备实体元素至少包括名称或和位置或和量词或和时间或和设备子部件或和设备状态信息;第四步,判断第三步中的设备实体元素与设备实体元素之间是否存在关系以及存在什么关系,得到设备实体元素间的关系信息;第五步,根据第四步中的关系信息,挖掘设备实体元素之间隐藏的关系,得到问句子图;第六步,构建知识图谱模型对第五步中的问句子图进行子图匹配,得到知识图谱三元组;第七步,计算第六步中的知识图谱三元组与问句子图的相似度,选择相似度最高的知识图谱三元组,作为问答答案,实现户外变电站的智能问答;所述第三步中,实体识别BERT+FLAT模型的构建方法如下:步骤31,对输入的变电设备历史故障案例文本进行向量化处理,得到案例词向量;步骤32,利用预训练模型BERT训练案例词向量生成词语树,从每一个句子的头部开始,按照最大匹配原则匹配得到对应字符下的所有词语,将词语信息直接置于句子尾部,得到训练文本;在预训练模型BERT中,能处理的最大文本长度为ZD,每个标识token都表示为一个BS维的向量;标识token为单个字符和词语,其进行标识身份token-id转换,经地址id映射得到一个(ZD,BS)的向量矩阵表示;步骤33,将步骤32中的训练文本输入到位置编码层进行编码,编码分为绝对位置编码和相对位置编码;绝对位置编码按照训练文本序列顺序得到;相对位置编码具有4种位置编码,每个字有两个相同的头部Head和尾部Tail位置编码,每个词有两个不同的头部Head和尾部Tail位置编码,每两个节点间计算得到四种相对距离,其具体的计算公式如下: 式中head[i]、tail[i]分别代表字或词的头部和尾部编码,、、、分别代表第i个字或词的头部与第j个的字或词的头部之间的距离;经全连接层对计算结果进行融合得到最终的相对位置编码,其计算公式如下: 式中代表可学习的参数,代表连接运算符,d是、、、和k表示ij位置编码的维度索引;步骤34,利用多头自注意力机制,结合步骤33中的相对位置编码,提取文本信息特征,文本信息特征的计算公式如下: 式中,,,和u,均为预训练模型BERT内的可学习参数;步骤35,将步骤34中的文本信息特征输入至鉴别式机率模型CRF层,预测输出带有实体标签的文本序列Y={Y1,Y2,Y3,...,Yn},得到变电设备故障案例的初步实体抽取结果;所述第四步中,关系信息的获取方法如下:步骤41,将设备实体元素进行向量化处理,变成长度相同的索引向量;步骤42,将步骤41中的索引向量对应的词向量cijt传输至神经网络层Bi-GRU进行语义编码,得到语义编码向量hijt;步骤43,将步骤42中的语义编码向量hijt输入到经逻辑回归softmax分类器得到关系分类结果;语义编码向量hijt的计算公式如下所示: 式中cijt表示在i时刻输入的第j个句子的第t个单词的词向量,Bi-GRU为神经网络函数,其包括前向和后向神经网络GRU,能充分地学习上下文关系;所述第六步中,知识图谱模型的构建方法如下:步骤61,将设备实体元素进行向量化处理,得到变成长度相同的索引向量;步骤62,将步骤61中的索引向量对应的词向量cijt传输至神经网络层Bi-GRU进行语义编码,得到语义编码向量hijt;步骤63,将步骤62中的语义编码向量hijt输入到经逻辑回归softmax分类器得到关系分类结果;步骤64,根据步骤63中的关系分类结果,采用图数据库Neo4j将抽取出来的设备实体元素和关系做知识存储,形成节点:设备实体元素和边:关系构成的关于变电设备故障的知识图谱;所述知识图谱中每一个设备实体元素对和它们之间的关系组成一个三元组h,r,t,h,r,t分别代表头实体,关系,尾实体;步骤65,利用关系预测模型将不同设备实体元素的路径补全,给步骤64中的知识图谱中不同的节点寻找潜在的有向边;所述第六步中,子图匹配的方法如下:问句子图采用图说子图同构算法VF2中的搜索树模型与知识图谱进行子图匹配,其匹配关系式如下:G1=(E1,R1),G2=(E2,R2),其中,G1为问句子图,G2为知识图谱,E为节点即设备实体元素的集合,R为边即关系集合;图说子图同构算法VF2中的每一个节点为s,s中包括一系列G1和G2中节点的映射key,value,其中,key代表G1中的节点,value代表G2中的节点;随着搜索树高度的增加,s中的key-value对会逐渐增多;当s中所有节点对都满足约束公式,就称这个状态s为一致状态,完成子图匹配;约束公式如下所示: ME1XE2表示问句子图、知识图谱中节点的对应关系集合,若节点,则表示与节点u对应的G2中的节点;如果节点,则表示与节点v对应的G1中的节点。
全文数据:
权利要求:
百度查询: 国网浙江省电力有限公司电力科学研究院 华北电力大学 一种用于户外变电站的智能问答方法及置于户外的机器人
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。