首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于知识图谱补全模型的文物安防风险要素识别方法 

申请/专利权人:中南民族大学;中电科芯片技术(集团)有限公司

申请日:2022-06-29

公开(公告)日:2024-06-25

公开(公告)号:CN115099504B

主分类号:G06Q10/04

分类号:G06Q10/04;G06Q50/26;G06F16/36;G06N5/02;G06N5/025;G06N3/084;G06N3/0499

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.04.12#著录事项变更;2022.10.14#实质审查的生效;2022.09.23#公开

摘要:本发明公开了一种基于知识图谱补全模型的文物安防风险要素识别方法,包括:获取文物的文本描述,将与该文物的文本描述对应的、该文物的所有相关特征整合成该文物的特征序列p1,p2,...,pn,其中pi表示与该文物的文本描述对应的、该文物的第i个特征,将步骤1得到的文物的特征序列输入训练好的知识图谱补全模型中,以得到该文物的嵌入向量表示l,基于得到的该文物的嵌入向量表示l获取链接预测的结果,将链接预测的结果作为该文物安防风险评估的指标项,并将该指标项作为识别到的该文物的安防风险要素。本发明能够解决现有风险要素识别和构建风险评估指标体系过程中,专家工作量大的技术问题。

主权项:1.一种基于知识图谱补全模型的文物安防风险要素识别方法,其特征在于,包括以下步骤:1获取文物的文本描述,将与该文物的文本描述对应的、该文物的所有相关特征整合成该文物的特征序列p1,p2,...,ps,其中pj表示与该文物的文本描述对应的、该文物的第j个特征,且有j∈[1,s],s表示与该文物的文本描述对应的、该文物的所有相关特征的总数;2将步骤1得到的文物的特征序列输入训练好的知识图谱补全模型中,以得到该文物的嵌入向量表示l;知识图谱补全模型是通过以下步骤构建的:2-1获取多个文物的安防风险评估指标体系,每一个安防风险评估指标体系中均包括文物及其对应的多个指标项;步骤2-1中的文物的安防风险评估指标体系是从已经被专家做过风险评估的文物单位的风险评估报告中获取的;每个安防风险评估指标体系中仅包括一个文物、以及该文物对应的多个指标项;安防风险评估指标体系对应的头实体就是该安防风险评估指标体系中的文物,尾实体就是该文物对应的多个指标项,关系就是该文物与每个指标项之间的包含关系;2-2根据步骤2-1得到的每个安防风险评估指标体系确定对应的头实体、关系和尾实体,并根据这些头实体、关系和尾实体生成该安防风险评估指标体系对应的多个三元组{hi1,ti1,ri1,hi2,ti2,ri2,...,hin,tin,rin},其中i∈[1,安防风险评估指标体系总数],n表示第i个安防风险评估指标体系对应的三元组总数,him表示第i个安防风险评估指标体系对应的第m个三元组中的头实体,tim表示第i个安防风险评估指标体系对应的第m个三元中组的尾实体,rim表示第i个安防风险评估指标体系对应的第m个三元组中的关系,m∈[1,n];2-3将步骤2-2得到的所有文物的所有安防风险评估指标体系对应的所有三元组中的所有头实体和尾实体组合成实体集E,将所有文物的所有安防风险评估指标体系对应的所有三元组中的所有关系组合成关系集R,将所有文物的所有安防风险评估指标体系对应的所有三元组组合成三元组集T,将实体集E、关系集R和三元组集T组合成第一数据集,将所有文物的文本描述构成的文本描述矩阵作为第二数据集;2-4将步骤2-3构建的第一数据集划分为第一训练集、第一验证集和第一测试集;2-5将步骤2-4得到的第一训练集输入基于翻译的TransH模型,以得到该第一训练集中实体集E的向量嵌入矩阵和关系集R的向量嵌入矩阵;2-6将步骤2-3构建的第二数据集划分为第二训练集、第二验证集和第二测试集;2-7将步骤2-6中的第二训练集输入自然语言处理模型Word2Vec中,以得到与第二训练集中每个文物的文本描述对应的、该文物的每个特征j对应的嵌入向量vwj,第二训练集中每个文物的所有特征对应的所有嵌入向量构成该文物对应的嵌入矩阵Vw=vw1,vw2,...,vws,其中j∈[1,s],s表示与第二训练集中每个文物的文本描述对应的、该文物的所有特征的总数;2-8针对步骤2-7获得的每个文物对应的嵌入矩阵而言,对该嵌入矩阵做平均,以获得该文物对应的单个代表嵌入向量Vh;2-9将步骤2-5获得的实体集E的向量嵌入矩阵和关系集R的向量嵌入矩阵、以及步骤2-8获得的每个文物对应的单个代表嵌入向量Vh输入转换函数Ψmap中,并使用批量随机梯度下降最小化损失函数来训练转换函数Ψmap,使得其损失值最小,从而得到每个文物在同一个向量空间的嵌入向量表示,并得到训练好的知识图谱补全模型;3基于步骤2得到的该文物的嵌入向量表示l获取链接预测的结果;步骤3包括以下子步骤:3-1设置计数器cnt=1;3-2判断计数器cnt是否等于第一训练集中实体集E中的向量总数,如果是则过程结束,否则转入步骤3-3;3-3计算步骤2得到的文物的嵌入向量表示l与步骤2-5得到的第一训练集中实体集E中第cnt个向量的向量嵌入e的L2范数距离D;3-4判断步骤3-3计算所得的L2范数距离D是否小于等于预设阈值,如果是则进入步骤3-5,否则转入步骤3-6;3-5将该L2范数距离D所对应的实体集E中的第cnt个实体作为链接预测的结果,然后转入步骤3-6;3-6设置计数器cnt=cnt+1,并返回步骤3-2;4将步骤3得到的链接预测的结果作为该文物安防风险评估的指标项,并将该指标项作为识别到的该文物的安防风险要素。

全文数据:

权利要求:

百度查询: 中南民族大学;中电科芯片技术(集团)有限公司 基于知识图谱补全模型的文物安防风险要素识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。