买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:电子科技大学
摘要:为了应对法律文本中行为极性分类的挑战,本发明引入了一种创新的算法模型,融合上下文注意力的对比学习ContrastiveLearningwithContextAttention,CLCA和CGCNCoreGraphConvolutionalNetwork,CGCN的行为极性分类模型。该模型专门设计用于行为极性分类任务,通过结合上下文信息和对比学习策略,以提升对复杂法律文本数据的分类准确性和效率。本发明针对法律领域行为极性分类的模糊性和抽象性,提出了融合标签信息的对比学习算法,兼顾了有标签的行为极性分类任务和对比学习任务,提高了行为在不同案件类别标签下的极性分类效果。对于上下文依赖问题,本发明引入特殊的上下文注意力机制,引导模型对存在的行为进行合理的聚合和区分,增强行为词嵌入在极性信息上的表征能力和模型对上下文内容的理解能力。本发明提出了CGCN网络,基于采样思想和对模型的横向扩展缓解了GCN网络在抗噪声方面的不足之处和特征表示能力退化现象,提高行为极性分类的泛化性和抗噪声能力。在公开文本分类数据集和法律数据集上的实验表明,使用本发明提出的模型可以有效提高行为极性分类的效果并且具有一定极性分类泛用性,本发明的模型较为契合法律领域的行为极性分类要求。
主权项:1.一种基于CLCA-CGCN的行为极性分类算法,其特征在于包含以下步骤:步骤1:算法总体用PLM模型的句子对输入方式可以让模型更多注意到与目标标签相关的描述,利用这个特点,设计出了提示词拼接原始文本的方法,引导模型去关注与当前行为相关的部分,结合本发明提出的特殊注意力机制,可以直接完成行为关键要素的词嵌入表示,词嵌入中与行为极性相关的信息得到了增强。步骤2:在设计上下文注意力模块设计时,使用PLM模型对输入序列做编码时往往只是基于其相关性做权重和得到新的结果,只考虑了正面的信息,忽略了负面的信息。在一些需要明确区分正面和负面信息的场合下,其词嵌入表示存在缺陷,尤其在行为极性分类问题上,行为的词嵌入表示需要融合相关的极性信息。基于这个问题,本模块提出了改进的上下文注意力,同时考虑了注意力的极性和上下文表示问题。步骤3:在设计CGCN模块时,主要有2个关键工作:对行为图进行采样分割;添加随机的跳跃连接,对图进行采样的目的是减少模型在单个节点聚合时梯度的大小,当聚合节点变少时,信息压缩的问题也会得到缓解,还可以帮助模型学习行为图的子空间特征。步骤4:在设计对比学习模块时,目的是作为辅助任务帮助模型区分难以判断的行为的极性。其基本原理是通过标签和行为的相似度信息,对比分析行为极性分类的输出结果,帮助模型学习行为间的相似性特征和行为极性类别的相似性信息。也提出了一种改进的策略,对批次内的嵌入表示进行dropout操作得到受到干扰的正样本,增加单个批次内的对比样本,提高本发明模型的通用性和多样性。步骤5:在设计训练损失函数时,对于对比学习任务,训练的目标是让正例间距离更近,负例间距离更远,交叉熵函数不能比较好的适应于训练目标。KL散度是一种比较两个分布间相似程度的方式。步骤6:将上述模块进行连接,整体模型采用步骤5中提出的损失函数,将数据集输入算法后得到结果。
全文数据:
权利要求:
百度查询: 电子科技大学 一种基于CLCA-CGCN的行为极性分类算法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。