首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于裁判文书结构和融合案件要素的类案匹配方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京理工大学

摘要:本发明公开的一种基于裁判文书结构和融合案件要素的类案匹配方法,属于自然语言处理领域。本发明利用裁判文书的固定结构进行分割,利用训练好的BERT‑BiLSTM‑CRF提取案件要素,形成融入案件要素的事实、事实‑推理、事实‑判决、依据四个部分。依据部分利用法条名称进行相似度计算。其余部分利用BERT模型进行编码,通过双向注意力机制形成原始文本、交互文本、文本差异度、文本相似度的融合高维语义。通过TextCNN‑BiLSTM‑Attention进行特征提取,计算余弦相似度之后和依据部分一起计算整体的相似度实现类案匹配的比较。本发明能够充分利用裁判文书结构且注重事实部分的重要性,且按照对应的部分对裁判文书进行匹配,显著提高类案匹配任务的精度。

主权项:1.一种基于裁判文书结构和融合案件要素的类案匹配方法,其特征在于:包括如下步骤,S1,收集相似的裁判文书和不相似的裁判文书形成案件匹配数据集,收集裁判文书和标注好的裁判文书的要素形成案件要素提取数据集;对裁判文书进行结构化处理,利用裁判文书固定格式用语分割成程序部分、事实部分、推理部分、判决部分、依据部分五个部分;舍去程序部分,利用案件要素提取数据集训练案件要素提取模型,将案件要素提取数据集中事实文本输入到BERT模型中建立对语义信息的构建,通过BiLSTM进一步强化上下文的语义信息的理解和认知,利用CRF技术对向量进行标注。将预测出的要素和实际要素进行对比计算损失函数,不断学习训练出一个能够自动化案件要素提取的BERT-BiLSTM-CRF模型。利用训练好的BERT-BiLSTM-CRF提取事实部分的案件要素,并将案件要素和事实部分拼接起来,得到融合案件要素的事实部分;以事实部分为核心,将事实部分与推理部分、判决部分分别拼接,得到事实-推理部分、事实-判决部分;S2,提取依据部分中的法条对应名称,计算两个案件中相同的法条数量,以两个案件中的法条最大数量作为分母,将两个案件中相同的法条数量作为分子,分子与分母相除得到依据部分的相似度;S3,将融合案件要素的事实部分、事实-推理部分、事实-判决部分分别利用预训练BERT模型进行编码,得到深层的双向语义表征,能够在多个不同层次提取关系特征,进而更全面反映句子语义;将得到的语义表征基于语义交互层利用注意力机制进行语义交互,得到交互后的案件语义表征;将原始语义表征和交互后的语义表征进行相减和相乘操作,得到案件语义差异性信息和案件语义相似性信息,使得后续的模型关注到文本的不同之处和相同之处;将原始语义表征、交互后的语义表征、案件语义差异性信息和案件语义相似性信息进行拼接,提取用于后续局部案件语义提取的具有因果联系和差异度、相似度信息的高维语义;将得到的高维语义输入到TextCNN层中,通过多个具有不同卷积核的CNN提取高维语义的案件局部特征,通过最大池化进一步提取关键信息,在降低数据维度和模型复杂度的同时使得类案匹配模型能够聚焦于案件最重要的部分;将得到的案件局部特征输入到BiLSTM-Attention层中,BiLSTM-Attention层是将输入到BiLSTM中得到的双向语义信息利用注意力机制进行加权,得到融合注意力权重的双向语义信息,在强化案件局部特征的联系的同时识别和关注到输入中更重要的部分。利用余弦相似度分别计算融合案件要素的事实部分和融合案件要素的事实部分之间、事实-推理部分与事实-推理部分之间、事实-判决部分与事实-判决部分之间的相似度;S4,将得到的依据部分的相似度、融合案件要素的事实部分的相似度、事实-推理部分的相似度、事实-判决部分的相似度拼接后通过全连接层输出,得到案件最终的综合相似度。将得到的综合相似度与阈值0.5进行比较,如果综合相似度大于0.5则判定案件是相似的,如果综合相似度小于0.5则判定案件是不相似的,通过这种方法生成预测标签,将预测标签和真实标签进行比较,采用交叉熵损失函数计算模型的损失函数,并计算梯度通过反向传播不断更新和学习。考虑到裁判文书的固定结构,从多个角度多个视角对案件对应的部分进行衡量,所得到的类案匹配模型能够有效提高类案匹配的精度。

全文数据:

权利要求:

百度查询: 北京理工大学 一种基于裁判文书结构和融合案件要素的类案匹配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。