一种基于主题增强的中文社交媒体少样本立场检测方法

导航：龙图腾网> 最新专利技术> 一种基于主题增强的中文社交媒体少样本立场检测方法

申请/专利权人：四川大学

申请日：2024-01-31

公开（公告）日：2024-04-19

公开（公告）号：CN117910466A

主分类号：G06F40/289

分类号：G06F40/289;G06F40/242;G06F18/214;G06F18/241;G06N3/0455

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.07#实质审查的生效;2024.04.19#公开

摘要：本发明涉及网络安全技术领域，公开一种基于主题增强的中文社交媒体少样本立场检测方法。该方法分为主题增强预训练和基于提示学习的多任务微调模块；首先通过目标语用权重算法得到不同目标的主题词组，而后通过掩码语言模型任务提高模型对目标主题的感知能力，得到主题增强预训练模型。然后，引入提示学习来捕获TRPM中的主题信息，并搭建多任务学习网络MT‑TRPM捕获情感知识，增强立场检测的性能。本发明能够为主题信息在立场检测领域的应用提供理论基础和研究思路。

主权项：1.一种基于主题增强的中文社交媒体少样本立场检测方法，其特征在于，包括以下步骤：步骤1：对大规模语料进行清洗与预处理，通过目标语用权重算法提取出与目标高度相关的主题词；步骤2：将主题词添加到分词器词典中进行汉语分词，再通过随机掩码预训练来构建基于词的多目标语料的预训练语言模型MT-BERT；步骤3：进行主题词增强预训练，来加强模型对目标的感知能力，得到主题增强预训练模型；步骤4：针对立场任务和情感任务构建不同的提示模板输入：将原始文本与提示模板后缀按照NSP任务的输入格式分为上下句，通过主题增强预训练模型获得立场信息嵌入向量和情感信息嵌入向量；步骤5：通过基于提示学习的多任务立场检测模型，进行立场检测为主，情感分析为辅的分类任务，具体为：将立场信息嵌入向量和情感信息嵌入向量生成两个具有上下文关系的词向量，再两个词向量进行拼接，通过全连接层进行变换后提取出立场掩码向量，再通过点乘来衡量该掩码向量与不同立场标签向量之间的距离，最后利用Softmax函数获得标签预测值。

全文数据：

权利要求：

百度查询：四川大学一种基于主题增强的中文社交媒体少样本立场检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具有调节功能的塑料藤条结构椅

下一篇：一种用于储水桶的多重密封结构

相关技术

一种具有调节功能的塑料藤条结构椅

一种用于储水桶的多重密封结构

一种装配式铝方通转角拼接结构

一种低温拉伸实验箱

一种改良聚乙烯颗粒物挤出成型设备

一种用于消毒的泵芯组装机

一种口腔扩张支撑装置

一种电动汽车用新能源节能充电桩

一种芦笋种植用废料混合装置

用于车辆顶板的显示装置和车辆

一种裁断效果好的液压裁断机

一种厌氧罐进水分布机构

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于主题增强的中文社交媒体少样本立场检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务