首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于图卷积神经网络的行政处罚文书的类案推荐方法_山东大学_202111309021.8 

申请/专利权人:山东大学

申请日:2021-11-05

公开(公告)日:2024-06-07

公开(公告)号:CN114048305B

主分类号:G06F16/335

分类号:G06F16/335;G06F16/35;G06N3/0455;G06N3/0464;G06N3/042;G06N3/088;G06Q50/18

优先权:

专利状态码:有效-授权

法律状态:2024.06.07#授权;2022.03.04#实质审查的生效;2022.02.15#公开

摘要:本发明涉及一种基于图卷积神经网络的行政处罚文书的类案推荐方法,包括:数据集的爬取、整合和预处理、文书子图构建、字词的联合特征匹配向量提取、基于孪生BERT的节点特征向量提取、基于图卷积的特征向量的聚合、分类获取最终的匹配结果、行政处罚文书的推荐。本发明对行政处罚文书的局部匹配向量进行了提取,并将其对应附加在图节点上,充分利用了行政处罚文书半结构化的特点。对提高行政执法文书的匹配以及推荐的准确率有至关重要的作用。

主权项:1.一种基于图卷积神经网络的行政处罚文书的类案推荐方法,其特征在于,包括步骤如下:A、数据集的爬取、整合和预处理首先,爬取行政处罚决定书,提取其中的文本内容,构建行政处罚文书原始数据集;然后,从政处罚文书原始数据集中自然语言中剔除掉无关因素,最后,按照行政处罚文书的半结构化的形式进行重构,并生成新的行政处罚文书数据集;B、文书子图构建首先,进行初步的关键字子图构建,将提取的每个关键词当作一个节点,如果两个关键词在文本的同一个句子中出现过,就用边将这两个节点相连;再通过关键词检测与合并来减少关键字子图中节点的个数,并将其重构成新的子图;然后,利用节点与行政处罚文书中每句话的TF-IDF余弦相似值,将每个句子附加到与其相似度最大的节点上;最后,利用每个节点上的附加的句子集的TF-IDF相似度来更新两两节点之间边的权重,从而完成子图的构建;C、字词的联合特征匹配向量提取对步骤B获取的任意两个子图进行句子集合并,即:分别计算两个句子集之间基于字词的相似度,包括TF-IDF余弦相似度、BM25余弦相似度、Simhash相似度、Jaccard相似度,串联得到基于字词的联合特征匹配向量;D、基于孪生BERT的节点特征向量提取基于孪生BERT的特征向量的提取模块包括结构完全相同且参数共享的两个BERT模型;步骤A获取的任意两篇行政处罚文书分别输入两个BERT模型,得到编码向量表示,连接两个编码向量,得到基于孪生BERT的节点特征向量;E、基于图卷积的特征向量的聚合将构建的子图和子图中每个节点上连接的匹配向量,输入到多层GCN神经网络来捕获多层次的特征信息;F、分类获取最终的匹配结果取GCN的最后一层所有节点的隐藏向量的平均值,将最终GCN层中的隐藏表示合并为一个固定尺寸的图匹配向量,之后将得到的最终匹配向量,通过一个分类网络进行分类来获取最终的匹配相似度;G、行政处罚文书的推荐基于行政处罚文书中的处罚所依据的法条构建相似库,将输入的行政处罚文书与相似库中行政处罚文书依次进行步骤B至步骤F,选取分数靠前的行政处罚文书进行推荐给执法人员。

全文数据:

权利要求:

百度查询: 山东大学 一种基于图卷积神经网络的行政处罚文书的类案推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。