首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多维度焦点问题生成的谣言检测数据增强方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安交通大学

摘要:本发明一种基于多维度焦点问题生成的谣言检测数据增强方法及装置,该方法包括:获取谣言数据;构建谣言检测数据集;提取多维语义焦点;基于多维语义焦点,生成与多维语义焦点对应的焦点问题;整合谣言检测数据和上述焦点问题,获取谣言检测增强输入;谣言真伪性预测;模型预测谣言真伪标签;通过集成学习对标签进行置信度权重优化,得到最终标签。该装置包括:获取谣言数据模块、构建谣言检测数据集模块和提取多维语义焦点模块等。本发明引入多维度语义焦点问题,对原始谣言数据进行数据增强,通过语义问题提示,使得预测模型能够更全面地理解谣言信息,进而更好的预测真伪标签,为网络舆情监测、信息保障提供更为全面、高效和优越的解决方案。

主权项:1.基于多维度焦点问题生成的谣言检测数据增强方法,其特征在于,包括以下步骤:获取谣言数据:从互联网上各大舆论平台,通过爬虫技术合法合规的爬取大量待检测谣言文本数据;构建谣言检测数据集:基于谣言文本数据,从中均匀挑选部分谣言子集,人工标注出该谣言子集中每条待测谣言文本的真伪标签,并从谣言文本不同语义层面的人工总结多个语义焦点和一系列焦点问题,获得用于后续谣言预测模型的学习和优化的谣言检测数据集;提取多维语义焦点:基于获得的谣言检测数据集,给定一条待检测真伪的谣言文本数据T,提取该谣言文本在不同角度不同语义层面的一系列多维语义焦点F;在提取谣言文本的多维语义焦点过程中,考虑了两个语义焦点探索途径:连续语义跨度和元数据指示;生成多维焦点问题:基于多维语义焦点,对每条谣言文本数据生成一系列与多维语义焦点对应的焦点问题;问题整合的输入增强:构造整合提示模板,基于该提示模板,将原待测谣言文本输入和焦点问题进行整合,对待测谣言文本输入进行语义增强,得到增强后的谣言文本输入;谣言真伪性预测:构建基于Transformer的谣言预测模型,通过该模型预测多组输入的谣言检测标签集合,并基于谣言检测数据集进行学习优化;谣言真伪性整合:基于多组谣言检测标签集合,通过集成学习对标签结果的置信度权重进行迭代更新,得到该谣言检测任务的最终标签。

全文数据:

权利要求:

百度查询: 西安交通大学 基于多维度焦点问题生成的谣言检测数据增强方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。