首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种复杂案件中的多被告多罪名关系抽取方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国司法大数据研究院有限公司

摘要:本发明公开了一种复杂案件中的多被告多罪名关系抽取方法及装置。本方法为:1获取多个案件的刑事判决书,并从每一刑事判决书中抽取出本院认为段落、审理经过段落和裁判结果段落;2对于每一裁判结果段落,从中抽取出当事人姓名和罪名,得到多人多罪的文书集合M;3从集合M中的各审理经过段落中抽取出各刑事判决书对应的前审关联案号,找到对应的起诉书;4根据各起诉书和集合M生成训练集训练串联模型,其包括BERT+CRF命名体识别模型和BERT分类模型;5对训练后的BERT分类模型训练,得到一预测模型;6对于一案件,从该案件的起诉书中提取本院认为段落并将其输入到预测模型,得到该案件中人名与罪名的对应关系。

主权项:1.一种复杂案件中的多被告多罪名关系抽取方法,其步骤包括:1获取多个案件的刑事判决书,并从每一所述刑事判决书中抽取出本院认为段落、审理经过段落和裁判结果段落;2对于每一所述裁判结果段落,从中抽取出当事人姓名和罪名,生成被告人与对应罪名的挂靠关系;对所抽取信息进行去重后,筛选出包含多人、多罪名的裁判结果段落对应的刑事判决书,得到多人多罪的文书集合M;文书集合M中的每个文本包含刑事判决书的案号、本院认为段落、审理经过段落、裁判结果段落、被告人、罪名、被告人与对应罪名挂靠关系;3从所述文书集合M中的各审理经过段落中抽取出各刑事判决书对应的前审关联案号;4根据筛选出的前审关联案号找到对应的起诉书;5从各所述起诉书中抽取出本院认为段落;6从所述起诉书的本院认为段落中抽取人名和罪名并去重,得到起诉书的人名集合Qname和罪名集合Qcrime;7将所述文书集合M中被告人姓名集合Mname、罪名集合Mcrime与人名集合Qname、罪名集合Qcrime分别进行匹配,若Mname=Qname且Mcrime=Qcrime,则判定所述文书集合M中每一案号对应的刑事判决书为一多人多罪样本,对每一多人多罪样本对应的所述起诉书的本院认为段落进行反标,生成训练集;8利用所述训练集中的样本数据训练串联模型;所述串联模型包括BERT+CRF命名体识别模型和BERT分类模型;所述BERT+CRF命名体识别模型用于从输入的样本数据中抽取人名和罪名并将其输入BERT分类模型,得到每一样本数据中的人名和罪名之间的关系;9利用所述文书集合M中样本对应的被告人和罪名之间的关系,对所述训练集内各样本对应的判决书中本院认为段落信息进行标注,将标注的判决书作为训练集训练步骤8训练后的串联模型,得到一预测模型;10将训练后的BERT分类模型作为ALBERT_TINY模型;将大量无标注的判决书输入所述预测模型,将输出结果作为对应判决书的伪标签数据,得到伪标签样本;利用判决书的裁判结果段落对对应的伪标签样本进行验证,筛选出准确的伪标签样本,然后利用准确的伪标签样本训练ALBERT_TINY模型,得到一新的预测模型;11对于一待提取的案件,从该案件的起诉书中提取本院认为段落并将其输入到训练后的ALBERT_TINY模型,得到该案件中人名与罪名的对应关系。

全文数据:

权利要求:

百度查询: 中国司法大数据研究院有限公司 一种复杂案件中的多被告多罪名关系抽取方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。