基于文本分类的多类型文本鉴伪方法及系统

导航：龙图腾网> 最新专利技术> 基于文本分类的多类型文本鉴伪方法及系统

申请/专利权人：南京邮电大学

申请日：2024-02-28

公开（公告）日：2024-06-25

公开（公告）号：CN118245599A

主分类号：G06F16/35

分类号：G06F16/35;G06F18/25;G06F18/2415;G06N3/0455;G06F18/22

优先权：

专利状态码：在审-公开

法律状态：2024.06.25#公开

摘要：本发明公开了基于文本分类的多类型文本鉴伪方法及系统，包括：收集文本数据，对文本数据进行预处理，利用bert预训练模型初步分类文本，并标记文本主题分类类型；提取输入到bert预训练模型的文本的语义向量，与文本主题分类类型标记进行融合；对原文本向量与文本标记与原文本融合向量相似度进行计算，对于相似度超过阈值的向量采用拼接向量进行文本鉴伪检测；利用训练好的二分类Roberta模型对添加文本标记的向量和原向量进行鉴别，得到最后的二分类向量。结合了文本分类标记实现针对不同领域文本的文本伪造自动鉴别，大大减少了人工工作，提升了检测效率；通过结合BERT模型和Roberta模型的先进文本处理技术，实现了对多类型文本的高效鉴伪。

主权项：1.基于文本分类的多类型文本鉴伪方法，其特征在于，包括：收集文本数据，对文本数据进行预处理；基于Bootstrapaggregating方法利用bert预训练模型初步分类文本，并标记文本主题分类类型；提取输入到bert预训练模型的文本的语义向量，与文本主题分类类型标记进行融合；对原文本向量与文本标记与原文本融合向量相似度进行计算，对于相似度超过阈值的向量采用拼接向量进行文本鉴伪检测，对于相似度未超过阈值的向量采用原文本向量进行文本鉴伪检测；利用训练好的二分类Roberta模型对添加文本标记的向量和原向量进行鉴别，得到最后的二分类向量，完成对文本的最终分类。

全文数据：

权利要求：

百度查询：南京邮电大学基于文本分类的多类型文本鉴伪方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于储能元件的转换器及电源系统

下一篇：一种低交叉极化抑制的宽带UWB天线及穿戴设备

相关技术

用于储能元件的转换器及电源系统

一种低交叉极化抑制的宽带UWB天线及穿戴设备

一种带固定结构的冲压装置

一种巡检方便的电容补偿柜

气动搬运平台

一种公共卫生用预防传染病喷雾装置

一种自动开盖的压力烹饪器具

一种杀菌效果好的卤制品杀菌锅

一种预应力钢绞线辅助穿束防缠绕工具

一种安装工具

一种水利施工用混凝土搅拌装置

一种泡菜水检测用的取样装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于文本分类的多类型文本鉴伪方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务