首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文档级事件论元提取方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津大学合肥创新发展研究院

摘要:本发明提供文档级事件论元提取方法及系统,方法包括:利用基于事件共指实体的文本标记模块进行语义相似度计算,检索、标记原始文本的事件共指实体,得到共指增强文本;基于双路编码器与解码器的模型结构,拼接原始文本、共指增强文本与对应事件描述模板,共享参数编码器编码得到文本表示,提取论元表示进行表示对齐,根据对齐损失函数进行模型优化;利用生成式事件论元识别和提取模块,处理得到文本表示,获取事件论元抽取生成序列,处理得到事件论元抽取结果。本发明解决了由于论元分散、论元与触发词间距离过大、文档冗余、误差传播,导致事件论元信息抽取准确性及模型泛化性较差的技术问题。

主权项:1.文档级事件论元提取方法,其特征在于,所述方法包括:S1、基于事件共指实体,设计文本标记模块,对原始文本中的实体、触发词以及论元角色名称进行编码,得到文本表示,通过对所述文本表示进行语义相似度计算及检索操作,得到并标记所述原始文本中所有的事件共指实体,根据所述事件共指实体获取共指增强文本,利用共指增强文本体现所述原始文本中的事件上下文信息;S2、基于双路编码器与解码器的模型结构,构建双路表示对齐模块,对所述原始文本、所述共指增强文本,分别与对应事件描述模板进行拼接操作,利用共享参数编码器进行编码,得到拼接文本表示,从所述拼接文本表示中提取论元表示,利用共享参数解码器处理所述论元表示,得到论元输出,根据所述论元输出进行表示对齐操作,结合对齐损失函数以及交叉熵损失,对论元提取模型进行模型优化训练操作;S3、利用生成式事件论元识别和提取模块,将测试文本输入所述论元提取模型,以进行模型测试操作,经过论元提取编码器处理得到测试文本表示,利用论元提取解码器处理所述测试文本表示,得到事件论元抽取结果。

全文数据:

权利要求:

百度查询: 天津大学合肥创新发展研究院 文档级事件论元提取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。