申请/专利权人:合肥大智慧财汇数据科技有限公司
申请日:2023-12-22
公开(公告)日:2024-03-26
公开(公告)号:CN117763087A
主分类号:G06F16/33
分类号:G06F16/33;G06F16/36;G06F40/295;G06F40/30;G06F18/214;G06N3/045;G06N3/0464;G06N3/094;G06Q50/18
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.04.12#实质审查的生效;2024.03.26#公开
摘要:本发明涉及自然语言处理技术领域,公开了裁判文书中判决结果多元要素抽取方法及系统。该方法首先获取判决结果文本样本,基于判决结果文本样本构建用于训练的数据集;采用数据集对基于CasRel框架的三元组提取模型进行训练;然后利用训练完成的三元组提取模型,提取待抽取多元要素的文本即待处理文本的所有三元组,从而得到三元组结果集;最后根据三元组结果集生成要素结果图,通过将判决子项范围应用于图搜索空间限制,利用图结构进行路径搜索,实现待处理文本中判决结果的多元要素抽取。本发明可实现多元要素抽取,有效避免信息错乱以及歧义问题,从而保证抽取的准确性。
主权项:1.裁判文书中判决结果多元要素抽取方法,其特征在于,包括以下步骤:S1.获取判决结果文本样本,每个样本包含至少一个判决项;S2.基于判决结果文本样本构建用于训练的数据集,构建过程为:获取每个判决结果文本样本的要素和要素关联关系,据此得到对应的多个三元组样本即完成数据标注,从而构建所述数据集;所述要素包括主体和多个客体;主体为当事人,客体的种类包括诉讼地位、费用信息、关联方和判决子项范围;三元组的格式为s,p,o;s表示主体,o表示客体,p表示主体和客体间的关系;其中,判决子项范围从判决结果一具体判决项的文本中节选得到,判决子项范围对应的三元组样本为当事人,判决项关系,判决子项范围,其中的判决项关系用于表示当事人与判决结果一具体判决项之间的关系;S3.采用数据集对基于CasRel框架的三元组提取模型进行训练;S4.利用训练完成的三元组提取模型,提取待抽取多元要素的文本即待处理文本的所有三元组,从而得到三元组结果集;S5.根据三元组结果集中的要素和要素关联关系生成要素结果图,通过将判决子项范围应用于图搜索空间限制,利用要素结果图的图结构进行路径搜索,实现待处理文本中判决结果的多元要素抽取。
全文数据:
权利要求:
百度查询: 合肥大智慧财汇数据科技有限公司 裁判文书中判决结果多元要素抽取方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。