买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京工业大学
摘要:本发明公开了一种基于伪孪生去噪网络的中文实体关系联合抽取方法,为弥补联合抽取任务对于语境信息和句法信息利用不充分问题,首先引入文本词性信息和依存句法信息进行先验特征学习,对生成的文本词性特征向量、文本语义特征向量和依存句法特征向量进行拼接和特征降维;将去噪门机制整合到孪生网络中,形成伪孪生网络,将特征降维后的特征向量分别输入到孪生网络和伪孪生网络中,对孪生网络获得的原始特征和伪孪生网络产生的去噪特征进行残差连接,形成伪孪生去噪网络,防止信息损失,并将其输入到关系导向网络执行联合抽取任务。通过伪孪生去噪网络可以很大程度上处理表示学习过程中产生的噪音特征,以此缓解一词多义和歧义问题造成的性能损失。
主权项:1.一种基于伪孪生去噪网络的中文实体关系联合抽取方法,其特征在于,包括以下步骤:步骤1:利用NLP工具对数据集创建词性和依存关系词汇表、分词和标注处理;对目标文本进行序列化和编码处理,生成特征向量,特征向量包括文本词性特征向量、文本语义特征向量和依存句法特征向量;步骤2:将生成的文本词性特征向量、文本语义特征向量和依存句法特征向量按照特征维度拼接在一起,形成一个高维特征向量;将得到的高维特征向量进行特征降维,得到一个低维特征向量;步骤3:对特征降维后的特征向量采用孪生网络进行相关性召回,将去噪门机制整合到孪生网络中,形成伪孪生网络;步骤4:将孪生网络与伪孪生去噪网络分别输出的特征向量进行残差连接,形成伪孪生去噪网络;步骤5:将步骤4中经过残差连接得到的特征向量执行头实体抽取,以及关系和尾实体的联合抽取任务。
全文数据:
权利要求:
百度查询: 北京工业大学 一种基于伪孪生去噪网络的中文实体关系联合抽取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。