首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于标签增强表示的罪名预测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:重庆大学

摘要:本发明提出了一种基于标签增强表示的罪名预测方法及系统,该方法为:选定案件作为样本集,给定样本集中每个案件输入描述;给定每个案件对应的罪名的标签输入描述;对每个案件描述进行编码,并得到每个案件描述中每个字的上下文相关的嵌入表示;对每个罪名标签进行编码,并得到每个罪名标签的嵌入表示;对编码后的罪名标签交替使用自注意力机制和交叉注意力机制,得到罪名增强标签表示;将案情文本表示与罪名增强标签表示拼接,经卷积神经网络模型中对该模型的分类器进行训练;将需预测的案件于训练完成的罪名预测模型中进行预测,得到预测罪名。本方法通过罪名增强标签表示所包含的语义信息使训练数据具有更好的解释性,从而获得较高的预测精度。

主权项:1.一种基于标签增强表示的罪名预测方法,其特征在于,包括以下步骤:选定案件作为样本集,给定样本集中每个案件输入描述,给定每个案件对应的罪名的标签输入描述:对每个案件输入描述Sd进行字粒度处理,得到案件事实描述Sd=表示案件输入描述文本中的第i个字,m是案件输入描述文本中字的数量,i为正整数,1≤i≤m;对每个罪名标签输入描述进行字粒度处理,得到罪名标签表示罪名标签c输入描述文本的第j个字,c为不大于L的正整数,L代表罪名标签的数量,p表示罪名字数;对每个案件事实描述进行编码,并得到每个案件事实描述中每个字的上下文相关的嵌入表示,记为案情文本表示Xf:将案件事实描述进行编码,将编码器的最后一层隐藏层输出作为案件事实描述中每个字的上下文相关的嵌入表示,即其中ds表示编码器最后一层隐藏层的维度,代表案件事实描述中第i个字对应的嵌入表示;对每个罪名标签描述进行编码,并得到每个罪名标签的嵌入表示,将包含所有罪名标签的嵌入表示的标签集记为ET:将罪名标签进行编码,将该编码器的最后一层隐藏层输出作为每个罪名标签在字粒度上的嵌入表示其中代表该罪名标签中第j个字对应的嵌入表示,将每个罪名标签的嵌入表示进行求和得到ec表示第c个罪名标签的嵌入表示,得到包含所有罪名标签的嵌入表示的标签集ET=[e1,e2,...,ec,...,eL];对编码后的罪名标签融合所述案情文本表示交替使用自注意力机制和交叉注意力机制,得到罪名增强标签表示具体的:根据transformer模型,采用具有Q-K-V的注意力模型:令键矩阵为查询矩阵为值矩阵为其中Wk、Wq、Wv为全零矩阵,由transformer的缩放点积注意力得到注意力输出其中N和M分别表示查询向量和键值的长度,D为词嵌入维度,Dk表示键或查询矩阵的维度,Dv表示值矩阵的维度;在向前反馈时进行残差连接,将得到最终输出作为罪名增强标签表示:其中hc指罪名标签c的特定表示;将所述案情文本表示Xf与罪名增强标签表示拼接起来,经卷积神经网络模型对该模型的分类器进行训练,得到训练完成的罪名预测模型;将需预测的案件于训练完成的罪名预测模型中进行预测,得到预测罪名。

全文数据:

权利要求:

百度查询: 重庆大学 一种基于标签增强表示的罪名预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。