首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于图卷积网络的甲骨字分类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安阳师范学院

摘要:本发明公开了一种基于图卷积网络的甲骨字分类方法,包括:首先构建了甲骨字的语境和字形网络,然后,筛选字形差别较大而语义相似的异体甲骨字,并抽取语义相似的甲骨字子网络,最后,利用图卷积网络对语义相似的甲骨字分类,分析语境和字形信息在甲骨字语义形成过程中所起的作用。该方法可有效提高语义预测的正确率。

主权项:1.一种基于图卷积网络的语义相似甲骨字分类方法,其特征在于,包括:利用甲骨文拓片卜辞,建立甲骨字语境网络;利用甲骨字构件,建立甲骨字形网络;根据收集的语义相似甲骨字,抽取甲骨字语境子网络和甲骨字字形子网络;融合甲骨字字形子网络和甲骨字语境子网络;将融合后的语义相似的甲骨字字形子网络和甲骨字语境子网络输入图卷积网络,对甲骨字进行分类;所述建立甲骨字语境网络包括:选定一片含有n个甲骨字的拓片O=[1,2,…,i,…,j,…,n];定义拓片上的两个甲骨字i和j之间的距离wij,并把wij值赋予语境网络的相似性矩阵Mij处;其中,wij的表达式为: 式中,li和lj表示甲骨字i和j在拓片中的位置,并且字j在字i的后面,β表示残缺甲骨字之间的距离;在不同的甲骨字拓片上同时出现两个甲骨字,分别计算这两个甲骨字在不同甲骨字拓片上的相似性距离,然后相加赋予相似性矩阵对应的位置上;根据71455片拓片,得到6199个甲骨字之间的相似性矩阵,相似性矩阵共包含160964条边,其中包含甲骨异体字;所述建立甲骨字形网络包括:以173个甲骨字部首为参照数据,对6199个甲骨字按照构件进行拆分,共得到3079个甲骨字构件;每个甲骨字i用3079个构件中的某几个构件来表示:γi:g1,g2,g3,…;根据公共邻居指标计算i和j之间的权重,建立了一个包含5890个节点和1198652条边的甲骨字形网络,相似性矩阵表示为S,其中公共邻居指标表达式为:Sij=|γi∩γj|式中,γi和γj分别为甲骨字i和j的构件集合;所述抽取甲骨字语境子网络和甲骨字字形子网络包括:从甲骨字库中整理出字形差别较大且异体甲骨字的语义相似数量为5以及以上的异体甲骨字VO,其中异体甲骨字的语义相似或相同;对于语境网络中的每一条边eij,如果连接eij的两个结点i和j属于VO,把边加入到子语境网络NV中;重复上一步,直到处理完所有边;通过删除权重小于5的边,得到一个包含1392个节点和41821条加权边的甲骨字语境子网络,其相似性矩阵可表示为MS;利用同样的方法,从甲骨字字形网络中抽象出一个具有1428个节点和57985个加权边的甲骨字字形子网络,其中,其相似性矩阵可表示为SS;所述融合甲骨字字形子网络和甲骨字语境子网络包括:选定甲骨字字形子网络;把甲骨字语境子网络,结点集合为Nc,添加到甲骨字字形子网络中:如果甲骨字语境子网络中的一条边的两个结点属于甲骨字字形子网络的结点NS,然后把边加入到甲骨字字形子网络中;重复上一步直到处理完甲骨字语境子网络中所有的边,得到含有452个结点和6990条边的融合网络NF;所述甲骨字字形子网络和所述甲骨字语境子网络均表示为图G=V,E;其中V表示所述甲骨字字形子网络和所述甲骨字语境子网络中结点的集合,n表示所述甲骨字字形子网络和所述甲骨字语境子网络中结点的个数;E表示所述甲骨字字形子网络和所述甲骨字语境子网络中边的集合,m表示所述甲骨字字形子网络和所述甲骨字语境子网络中边的个数;所述甲骨字字形子网络和所述甲骨字语境子网络的图G也用相似性矩阵A表示,Aij=wij表示结点i和j之间有一条权重值的边相连;Aij=0表示结点i和j之间无边相连,假设所述甲骨字字形子网络和所述甲骨字语境子网络中每个结点i的特征表示为一个c维向量那么所述甲骨字字形子网络和所述甲骨字语境子网络中所有结点表示为特征矩阵X={x1,x2,…,xn}∈Rn×c。

全文数据:

权利要求:

百度查询: 安阳师范学院 一种基于图卷积网络的甲骨字分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。