买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆理工大学
摘要:本发明具体涉及双编码器证据蒸馏神经网络的可解释性虚假新闻检测方法,包括:通过虚假新闻检测模型输出新闻的真实性预测标签和真实性解释;训练模型时包括:编码新闻向量表示和原始报告文档表示;基于Gumbel‑softmax函数选取有价值报告;从有价值报告中提取可解释性句子;分别构建新闻图结构和原始报告图结构并实现图注意力交互,生成原始报告增强的新闻表示;生成最终向量表示并通过分类器生成新闻的真实性预测标签;通过提取的可解释性句子组成新闻的真实性解释;计算模型损失来优化模型参数,直至模型收敛。本发明能够有效解决有价值报告选取时固定K值的问题,同时能够从有价值的报告中提取可解释性句子来实现新闻虚假检测。
主权项:1.双编码器证据蒸馏神经网络的可解释性虚假新闻检测方法,其特征在于,包括:S1:获取新闻及其相关的若干个原始报告作为待检测信息;S2:将待检测信息输入经过训练的虚假新闻检测模型中,输出对应新闻的真实性预测标签和真实性解释;通过如下步骤训练虚假新闻检测模型:S201:获取作为训练数据的新闻及其相关的若干个原始报告;S202:对新闻和原始报告进行编码,得到新闻向量表示和原始报告文档表示;S203:基于Gumbel-softmax函数根据新闻向量表示和原始报告文档表示从所有原始报告中选取有价值报告,并得到有价值报告的向量表示;步骤S203中,将新闻向量表示作为查询Q,并为每个原始报告文档表示分配不同的注意力权重以评价每个原始报告对于新闻的重要性,其中二维向量的第一维值为1的原始报告对于新闻来说是有价值的;是一个二维向量,把第一维值为1的报告视为有价值的报告;公式描述为: 式中:表示压缩后的所有原始报告文档表示;表示原始报告文档表示;表示原始报告的数量;hc表示新闻向量表示;表示每个原始报告对于新闻的重要性;和表示可训练的参数矩阵;使用Gumbel-softmax函数来实现注意力权重的学习;公式描述为: 式中:τ0是控制选择分布的温度参数;gj是从Gumbel-softmax分布中作为噪音扰动采样得到的独立同分布;当τ→0,近似于一个one-hot向量,当τ→∞,近似于一个均匀分布,当τ→1,Gumbel-softmax函数近似于Softmax函数;S204:根据有价值报告的向量表示从有价值报告中提取可解释性句子,并得到可解释性句子的向量表示;S205:分别为新闻和原始报告构建新闻图结构和原始报告图结构,并实现新闻图结构与若干个原始报告图结构之间的图注意力交互,生成原始报告增强的新闻表示;S206:根据可解释性句子的向量表示和原始报告增强的新闻表示生成最终向量表示,进而通过分类器生成新闻的真实性预测标签;S207:通过提取的可解释性句子组成新闻的真实性解释;S208:根据新闻的真实性预测标签计算模型损失来优化模型参数;S209:重复步骤S201至S208,直至虚假新闻检测模型收敛;S3:将对应新闻的真实性预测标签和真实性解释作为其可解释性虚假检测结果。
全文数据:
权利要求:
百度查询: 重庆理工大学 双编码器证据蒸馏神经网络的可解释性虚假新闻检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。