首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于知识图谱的输电工作票智能检索方法_国网江苏省电力有限公司扬州供电分公司_202311588704.0 

申请/专利权人:国网江苏省电力有限公司扬州供电分公司

申请日:2023-11-27

公开(公告)日:2024-06-21

公开(公告)号:CN117708280B

主分类号:G06F16/332

分类号:G06F16/332;G06F16/31;G06F16/338;G06F16/36;G06F16/903;G06F16/955;G06F40/295;G06N3/0464;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.04.02#实质审查的生效;2024.03.15#公开

摘要:本发明公开了一种基于知识图谱的输电工作票智能检索方法及系统,具体涉及知识图谱技术领域,从数据源中获取输电工作票相关信息,遍历输电工作票数据建立实体、关系和属性三元组,构建一个涵盖输电工作票相关信息的知识图谱,对输电工作票文本进行实体识别和抽取,并将其与知识图谱中的实体相对应,将用户输入的查询语句进行解析,采用反向传播算法更新模型参数,准确预测查询的意图,利用知识图谱中实体之间的关系和属性信息,找到与查询条件匹配的输电工作票相关知识点,根据查询的结果,生成符合要求的输电工作票列表,将排序后的查询结果按照列表格式呈现工作票的基本信息,展示给用户,实现对大量输电工作票数据的快速检索,提高检索效率。

主权项:1.一种基于知识图谱的输电工作票智能检索方法,其特征在于:具体包括以下步骤:101、通过构建一个涵盖输电工作票相关信息的知识图谱,建立实体及其属性关系;102、对输电工作票文本进行实体识别和抽取,与知识图谱中的实体相对应;步骤102中,对输电工作票文本进行实体识别和抽取,识别出文本中的实体,包括设备名称、工作任务、工作人员,并将其与知识图谱中的实体相对应,具体包括以下内容:实体识别:将输入的文本以及对应的分词标签,标注好的中文分词数据集作为训练数据,从训练数据中提取特征,包括字向量、词性、上下文信息用于训练模型,进行实体识别,具体包括以下步骤:数据准备:获取输入的文本以及对应的分词标签,标签表示每个词语的边界位置,B表示词语起始位置,I表示词语中间位置,O表示词语外,得到一份标注好的中文分词数据集作为训练数据;特征提取:从训练数据中提取特征用于训练模型,所述特征包括字向量、词性、上下文信息,使用词嵌入技术将词转化为向量表示,随机取出两个词向量x和y,x的词向量表示为x1,x2,…,xn,y的词向量表示为y1,y2,…,yn,对于词向量x和y,通过计算两个向量之间的直线距离,表示词向量之间的相似度,具体计算公式如下: 其中,P表示点x1,x2,…,xn与点y1,y2,…,yn之间的欧氏距离;|X|为点x1,x2,…,xn到原点的欧氏距离,欧氏距离的计算结果越接近于0,表示两个向量越相似;实体关系抽取:选择感知机机器学习算法,构建模型并进行训练,训练过程中,将输入的特征作为模型的输入,输出预测的边界标签,预测实体间的关系,具体包括以下步骤:感知机接收输入向量x,并将其与权重向量w进行线性加权求和,通过激活函数进行判断输出结果,线性加权求和公式具体如下: S=w 1 ×x1+w2×x2+…+wn×xn其中,S表示求和的结果,w1,w2,…,wn表示权重,x1,x2,…,xn表示对应的数值;初始化权重向量w和偏置b,对于每个样本x,y,计算预测输出值,具体公式如下: 其中,x表示输入特征向量,y表示标签,η表示学习率;预测正确y_hat=y,继续下一个样本,预测错误y_hat≠y,更新权重向量和偏置,继续对当前样本进行迭代更新直到预测正确;103、从文本中抽取得到的实体和关系进行结构化表示,存储在关系数据库中;104、将用户输入的查询语句进行解析,识别关键词、实体及其属性;步骤104中,根据解析得到的查询条件,在知识图谱中进行查询,利用知识图谱中实体之间的关系和属性信息,找到与查询条件匹配的输电工作票相关知识点,具体包括以下内容:实体关系扩展:根据输电工作票的相关性,对找到的实体进行关系扩展,查找与输电工作票相关的实体,逐步扩展与输电工作票相关的实体之间的关系,提取关联知识点,具体包括以下步骤:分析实体之间的关系类型:通过对知识图谱中实体之间关系的统计,分析已找到的实体与输电工作票之间的关系类型,具体包括:申请者填写者:输电工作票的申请者填写者,负责提出申请、填写工作票的相关信息;审批者审核者:输电工作票的审批者审核者,对输电工作票的内容进行审批、审核,并决定是否批准该工作票;执行者操作者:实际执行输电工作的人员,根据工作票中的指示进行工作,并确保按照规定程序完成任务;搜索和发现新的关联实体:基于已知的关系类型,搜索与找到的实体有关联的其他实体;扩展关系路径:根据搜索到的新实体,将其与已知的实体进行关联,形成新的关系路径;筛选和验证关系:根据领域知识对扩展后的关系进行筛选和验证,排除无关的关系,确保扩展后的关系具有合理性和准确性;属性过滤:根据查询条件中的属性限制,筛选符合条件的实体和关系,向知识图谱发送查询请求,获取包含相关实体和其属性的数据,从查询结果中提取出与属性条件对应的属性值,通过Trie树算法,对提取的属性值进行匹配,判断是否符合属性条件,根据属性匹配的结果,筛选出符合条件的实体,保留匹配成功的实体,去除不符合属性条件的实体,具体包括以下步骤:将每个字符串拆分为一个个字符,按照顺序构建成树的节点,从根节点开始,每个节点表示一个字符,从根节点到叶子节点的路径为一个完整的字符串;节点结构:每个节点包含一个字符、指向子节点的指针数组以及一个标记表示该节点为一个字符串的结束;插入操作:从根节点开始,按照字符串的字符顺序逐级插入节点,直至字符串的最后一个字符,字符对应的子节点已存在,继续向下插入,不存在创建新的节点;查找操作:从根节点开始,按照目标字符串的字符顺序逐级匹配节点,所有字符成功匹配,并且最后一个字符所在的节点标记字符串的结束,表示查询成功;前缀匹配:查找具有指定前缀的所有字符串,从根节点开始匹配前缀,直到前缀字符串的最后一个字符;105、利用知识图谱中实体之间的关系和属性信息,找到与查询条件匹配的输电工作票相关知识点;106、根据查询的结果,生成符合要求的输电工作票列表,按照排序策略对结果进行排序;107、将排序后的查询结果按照列表格式呈现工作票的基本信息,展示给用户。

全文数据:

权利要求:

百度查询: 国网江苏省电力有限公司扬州供电分公司 一种基于知识图谱的输电工作票智能检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。