买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京工商大学
摘要:本发明公开了一种基于实体语义图的网购食品安全舆情事件抽取方法,包括:实体识别过程:通过条件随机场CRF层进行实体识别,通过Viterbi算法对实体标签完成解码工作;实体语义图构建阶段:获得更新后融合文档信息的实体表示,通过图卷积网络连接到不同的节点信息,利用图卷积网络得到的图结构来获得文档层面的表示特征;事件类型识别阶段;论元抽取阶段:抽取论元角色,在已经抽取的论元角色上进行排序,利用这种反馈过程确定论元角色,并将事件记录的信息存储到全局内存中。本发明提高了网购食品安全舆情事件抽取精度,将有助于维护电商平台的稳定性和可持续性。
主权项:1.一种基于实体语义图的网购食品安全舆情事件抽取方法,其特征在于,包括实体识别过程、实体语义图构建过程、事件类型识别过程、论元抽取过程,其中:实体识别过程:对采集到的原始数据进行预处理,对预处理后的文本进行人工标注,以形成一个完整的语料库,将经过预处理的文本中每个句子的单词向量输入到句子级编码器中,获取文本中句子和实体的嵌入表示,得到每个单词序列的嵌入表示,通过条件随机场CRF层进行实体识别,通过Viterbi算法对实体标签完成解码工作;实体语义图构建阶段:对实体节点使用平均池化策略进行压缩,得到该实体节点的嵌入表示,对句子节点中的标记使用最大池化策略进行压缩并加上该句子的位置编码,得到该句子节点的嵌入表示,采用不同规则构成五种类型的边,通过图卷积网络连接到不同的节点信息,利用图卷积网络得到的图结构来获得文档层面的表示特征;事件类型识别阶段:首先,将输入文本经过嵌入层处理,然后送入多层Transformer编码器以进行特征提取,得到所有时间步的隐藏状态表示,接着利用全局池化层将这些隐藏状态表示转换为一个固定大小的特征向量,最后,通过全连接层进行分类;论元抽取阶段:抽取论元角色,在已经抽取的论元角色上进行排序,利用反馈过程确定论元角色,并将事件记录的信息存储到全局内存中。
全文数据:
权利要求:
百度查询: 北京工商大学 一种基于实体语义图的网购食品安全舆情事件抽取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。