恭喜吉林大学刘露获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜吉林大学申请的专利一种同步追踪实体与关系的方面-观点对抽取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115033667B 。
龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210796028.5,技术领域涉及:G06F16/334;该发明授权一种同步追踪实体与关系的方面-观点对抽取方法及系统是由刘露;张玥;彭涛;包铁;王上;张雪松设计研发完成,并于2022-07-06向国家知识产权局提交的专利申请。
本一种同步追踪实体与关系的方面-观点对抽取方法及系统在说明书摘要公布了:本发明公开了一种同步追踪实体与关系的方面‑观点对抽取方法及系统,属于情感分析技术领域,所述一种同步追踪实体与关系的方面‑观点对抽取方法包括以下步骤:获得评论句,并采用预训练好的BERT模型对输入的评论句进行初始词向量编码;进一步学习评论句中所有实体的表示,并计算任意两个实体间的关联度,获得进一步编码后的实体表示序列以及关联度矩阵;根据实体表示对实体进行角色识别;根据关联度矩阵判断实体间是否存在关系;根据角色识别和关系识别的结果,抽取出方面‑观点对,具有多次充分交互、相互依赖、实体针对可扩展性和适用性强的优点。
本发明授权一种同步追踪实体与关系的方面-观点对抽取方法及系统在权利要求书中公布了:1.一种同步追踪实体与关系的方面-观点对抽取系统,其特征在于,所述系统包括:词嵌入模块,用于通过预训练好的BERT模型对输入的评论句进行初始词向量编码;追踪网络模块,用于获得进一步编码后的实体表示序列以及关联度矩阵;实体标注模块,用于根据实体表示对实体进行角色识别;关系分类模块:用于根据关联度矩阵判断实体间是否存在关系;推理模块,用于根据实体标注模块和关系分类模块识别的结果,抽取出方面-观点对;所述词嵌入模块中采用BERT模型作为初始编码器,BERT模型用于学习包含上下文信息的实体初始表示,BERT的输入向量ei是三个嵌入特征向量的和,包括token嵌入位置嵌入和段嵌入 token嵌入是利用WordPiece对句子进行token化来获得的,BER在句子的开头和结尾处分别添加[CLS]和[SEP],以获得完整的token序列,亦即实体序列,token嵌入通过将每个token转换为其在BERT中对应的id来生成,位置嵌入将token的位置信息编码成特征向量,段嵌入用于区分一段话中的不同句子;所述追踪网络模块包括一组门控RNN构成的追踪网络,其中,每条RNN链在每个时间步共享可训练参数,将评论句中所有的token设置为追踪目标,同时,各时间步的输入序列也设置为评论句的token序列,构成一个展开后为N×N网格形状的网络,该网络用于在每个时间步的计算单元A内同步更新所有token的表示并计算两个token间的关联度;在计算单元A中,实体表示的更新过程和关联度的计算过程高度依赖,具体来说,在每一时间步,利用被追踪的token信息、当前时间步输入的token信息以及两个token间的关联度来更新被追踪token的表示:hi,t=fxi,hi,t-1,xt,ri,t;用hi,t来存储被追踪tokenxi在时间步t更新后的表示,3中,hi,t-1为被追踪tokenxi在上一时间步的表示,xt为时间步t输入的token,ri,t就是tokenxi和tokenxt之间的关联度,其计算方式如下:ri,t=ghi,t-1,xt。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉林大学,其通讯地址为:130012 吉林省长春市前进大街2699号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。