买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工程大学
摘要:本发明提供的是一种基于语义增强的仇恨言论检测方法、系统及存储介质。本发明提出了基于语义增强的仇恨言论检测模型HSIBSE。其中包括信息嵌入层装置、文本嵌入层装置、编码层装置和输出层装置。通过使用仇恨言论词典,对文本进行分类,将其划分为含有负面性词语和不含负面性词语的两个类别。对每个词语,本发明将其与负面性词语词典中的词汇进行匹配,以确定其是否属于负面性词语。能够更准确地识别和分析仇恨言论,并为仇恨言论检测提供重要线索。本发明设计了一种基于语义增强的仇恨言论检测系统及方法,加强上下文理解,分析仇恨言论中的情感倾向,增强信息关联,有助于识别某些文本中的隐含信息,可广泛应用于社交网络中的互仇恨言论检测。
主权项:1.一种基于语义增强的仇恨言论检测方法,其特征在于:包括以下步骤:步骤1、信息嵌入层,将仇恨言论词典中的仇恨信息嵌入到模型中;首先需要根据已构建的仇恨言论词典,将仇恨信息融入到句子中;在句子中,仇恨言论通常表达对某一群体的敌意或歧视,根据仇恨言论的侮辱性词汇对推文内容进行鉴别;有效地提高特征词的覆盖率和特征维度,从而提高模型的检测性能;通过信息嵌入层的处理,模型能够识别仇恨言论,并提供全面的分析结果,为打击仇恨言论提供支持。步骤2、文本嵌入层,进行语言模型的预测任务;模型会在序列中加入一些特殊的符号"[MASK]",这些符号表示对应位置的单词需要被预测,即被模型替换为合适的单词;即在给定上下文的情况下预测缺失的单词,而"[MASK]"符号表示了需要预测的单词位置;步骤3、编码层,包括多个Transformer模块,每个模块包括:多头注意力层、前馈神经网络子层和归一化层;每个子层都有一个残差连接和一个层归一化步骤;在完成了文本的嵌入后,将表示向量送入多头注意力层中,输入被映射为三个向量:查询向量Q、键向量K和数值向量V;这三个向量用于计算注意力得分,从而决定输入向量的权重,再根据权重对输入向量进行加权平均;步骤4、输出层,输出层对句子中是否含有仇恨言论进行预测;通过一个全连接层,将最后一层的所有隐藏状态进行线性变换并加上一个偏置项,然后通过一个激活函数得到最终的输出向量。
全文数据:
权利要求:
百度查询: 哈尔滨工程大学 一种基于语义增强的仇恨言论检测方法、系统及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。