首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种借助谣言检测数据增强的少样本监督中文事实核查系统_西安交通大学_202410144684.6 

申请/专利权人:西安交通大学

申请日:2024-02-01

公开(公告)日:2024-06-04

公开(公告)号:CN118133151A

主分类号:G06F18/2415

分类号:G06F18/2415;G06F18/214;G06F18/21;G06N3/0455;G06N3/047;G06N3/084;G06N3/082;G06N3/096;G06N3/0464;G06N3/0895;G06N3/09

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.21#实质审查的生效;2024.06.04#公开

摘要:本发明公开了一种借助谣言检测数据增强的少样本监督中文事实核查系统,利用跨任务数据增强的知识迁移,从虚假新闻检测任务中获取外部监督信号,辅助执行中文事实核查任务。具体来说,该系统包括:跨任务提示级联模块,旨在将给定中文谣言检查任务输入和中文事实核查任务的输入处理为形式统一的语义表征序列;基于语言模型的高效参数微调模块:基于上述的语义表征序列,通过该模块获得语言模型序列概率分布;标签解码模块:设计基于映射表查询的标签检索和基于概率序列排序的标签检索的管道式两步走策略,对语言模型序列概率分布进行解码,结合构造的跨任务标签映射规则表与预定义目标序列,查询匹配出最终的中文事实核查任务标签。

主权项:1.一种借助谣言检测数据增强的少样本监督中文事实核查系统,其特征在于,包括以下模块:跨任务提示级联模块,包含任务分解前缀和提示联合模板,基于中文谣言检查任务和中文事实核查任务的输入,构造出形式统一的语义表征序列;给定中文谣言检查任务输入和中文事实核查任务作为输入,通过任务分解前缀与提示联合模板的管道式处理,合并为形式统一的语义表征序列,即该跨任务提示级联模块的输出;基于语言模型的高效参数微调模块,包含固定参数的预训练语言模型和小规模外接可优化参数网络,基于形式统一的语义表征序列,通过编码与解码操作,预测其对应的语言模型序列概率分布;标签解码模块,包含一组预定义目标序列和一个跨谣言检查与事实核查任务的标签映射规则表,N=2,为原始谣言检测任务标签类别数;对预测的语言模型序列概率分布,展开解码操作,即通过设计跨任务标签映射规则表和预定义目标序列,通过管道式的两步走策略:基于映射表查询的标签检索和基于概率序列排序的标签检索,查询匹配出与语言模型概率序列的拟合程度最高的中间答案,从而确定中文事实核查任务的最终标签。

全文数据:

权利要求:

百度查询: 西安交通大学 一种借助谣言检测数据增强的少样本监督中文事实核查系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。