一种面向法院电子卷宗的案情信息自动抽取方法

导航：龙图腾网> 最新专利技术> 一种面向法院电子卷宗的案情信息自动抽取方法

申请/专利权人：太极计算机股份有限公司

申请日：2020-11-30

公开（公告）日：2023-06-23

公开（公告）号：CN112417880B

主分类号：G06F40/295

分类号：G06F40/295;G06F40/216;G06F40/242;G06F40/30;G06F16/335;G06Q50/18

优先权：

专利状态码：有效-授权

法律状态：2023.06.23#授权;2021.03.16#实质审查的生效;2021.02.26#公开

摘要：本发明公开了一种面向法院电子卷宗的案情信息自动抽取方法，该方法包括：创建案情信息抽取框架，对各类案件电子卷宗文件中案情要素进行统计分析，构建基本案情本体；根据案情本体和电子卷宗文件版面特点，定制基本案情信息抽取策略；基于XML的跨领域信息抽取工具TZIE，构建案情信息抽取框架；基于多粒度语义的法律文书构建NER模型及训练，多粒度语义单元的结合方式，采用Word2vec的Skip‑gram模型和LDA主题模型，分别训练得到司法领域词向量模型和字向量模型，结合BiLSTM‑Attention‑CRF模型的领域实体识别，在基准模型BiLSTM‑CRF中增加了Attentio机制，预测每个语义单元属于不同标签的概率，辅助优化的模型训练方式，以人工标注语料训练模型作为主任务，以人工和自动标注语料训练模型作为辅助任务。

主权项：1.一种面向法院电子卷宗的案情信息自动抽取方法，其特征在于，该方法包括以下步骤：S1创建案情信息抽取框架，进一步包含：S1.1对各类案件电子卷宗文件中案情要素进行统计分析，构建基本案情本体；S1.2根据案情本体和电子卷宗文件版面特点，定制基本案情信息抽取策略；S1.3基于XML的跨领域信息抽取工具TZIE，自定义抽取领域要素信息，构建案情信息抽取框架，提供领域词典、规则及现有模型组合配置；S2基于多粒度语义的法律文书构建NER模型及训练，进一步包含：S2.1多粒度语义单元的结合方式，采集一个包含400多万份裁判文书的中文语料集，采用Word2vec的Skip-gram模型和LDA主题模型，分别训练得到司法领域含有主题语义的词向量模型和字向量模型，另外，不同案件类型的裁判文书中，使用LDA主题模型的向量模型，获取更大粒度上的语义信息；S2.2结合BiLSTM-Attention-CRF模型的领域实体识别，在基准模型BiLSTM-CRF中增加了Attentio机制，预测出每个语义单元属于不同标签的概率，在BiLSTM模型上接入CRF模型，使得BiLSTM模型在计算最优标签序列时合理体现CRF模型转移矩阵；S2.3基于辅助优化的模型训练方式，以人工标注语料训练模型作为主任务，以人工和自动标注语料训练模型作为辅助任务，后者向前者共享BiLSTM模型层的输出。

全文数据：

权利要求：

百度查询：太极计算机股份有限公司一种面向法院电子卷宗的案情信息自动抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种切割机的集尘装置

下一篇：一种护理液调和储存罐

相关技术

一种切割机的集尘装置

一种护理液调和储存罐

一种稳固性良好的电动自行车

一种船舶舷外机通风型保护罩

一种可快速拼接的安装架

一种建筑施工用抹灰装置

一种用于消毒的泵芯组装机

一种刀片可调节的修边机

一种工具携行包

一种升降式饺子加工压面机

一种水冷导槽夹紧器

一种微型制冷压缩机

案情相关技术

一种基于图神经网络的司法文书案情要素实体识别方法_北京计算机技术及应用研究所_202210598184.0

基于案情事实的法条智能推荐方法及系统及装置及介质_成都数之联科技股份有限公司_202011609552.4

案情文本中智能提取文本摘要的方法、系统及电子设备_新智认知数据服务有限公司_202110198207.4

一种基于案情的处置预案生成方法_中国科学技术大学_202311083500.1

一种基于案情描述的类案推送方法与装置_浪潮软件集团有限公司_202010384979.2

相似案情确定方法、装置、设备、介质和程序产品_中国政法大学_202211733618.X

基于再注意力机制和对比损失的法律案情要素抽取方法_湖南大学_202310537953.0

一种面向法院电子卷宗的案情信息自动抽取方法_太极计算机股份有限公司_202011369142.7

基于主动学习和半监督学习的案情特征标注方法、装置和设备_太极计算机股份有限公司_202310218333.0

基于主动学习和半监督学习的案情特征标注方法、装置和设备_太极计算机股份有限公司_202310218333.0

卷宗相关技术

一种音视频电子卷宗要素智能分析方法及系统_杭州正义先铎网络科技有限公司_202410179570.5

基于移动终端的电子卷宗信息发布系统_广西北投声远科技股份公司_202311339835.5

一种基于动态绑定的发动机卷宗数据自动采集方法_沈阳东睿科技有限公司_202111583641.0

一种便携式案件卷宗归目辅助器及其操作方法_南京北明软件有限公司_202210720671.X

一种卷宗用收纳装置_冯瑞莹_202321943090.9

一种电子卷宗智能标注管理系统_河南简德网络科技有限公司_202311700699.8

一种在线自学习的法院电子卷宗文本分类方法_太极计算机股份有限公司_202110188680.4

卷宗管理系统_北京工业大学_202210147355.8

基于智能卷宗的智能中间柜管理系统_广西北投声远科技股份公司_202311459953.X

基于文本检测和表格检测的电子卷宗图像智能矫正方法_北京工业大学_202311683618.8

信息相关技术

程序、信息处理装置以及信息处理方法_株式会社CaTe_202280076634.8

信息处理设备和信息处理方法_索尼互动娱乐股份有限公司_202080020437.5

程序、信息处理设备和信息处理方法_索尼集团公司_202280076642.2

信息处理装置以及信息处理方法_夏普株式会社_202011053138.X

信息处理方法和信息处理装置_丰田自动车株式会社_202311817053.8

一种可选编码信息的信息印章_成都管宇网络科技有限公司_202322637561.X

信息处理装置_丰田自动车株式会社_202311810430.5

生物信息检测器_株式会社壮健_202080003209.7

信息输入方法和装置_维沃移动通信有限公司_202110749194.5

信息上报方法及装置_中国移动通信有限公司研究院_202211673303.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种面向法院电子卷宗的案情信息自动抽取方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务