一种基于困惑度过滤的中文后门攻击防御方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：桂林电子科技大学

摘要：后门攻击在当下自然语言处理领域研究十分广泛，许多对于预训练语言模型的后门攻击方法都涌现出来使得人们警醒在当下语言模型应用中要注意的安全问题。该方法通过使用大型预训练语言模型对后门攻击中的有毒文本数据进行过滤。采用预训练语言模型中已有的训练知识，对带有触发器的有毒数据进行流畅性的评估。通过流畅性的评估指标困惑度的数值对有毒数据进行评估，在进行后门训练的前一环节对训练数据中潜在的有毒数据进行过滤剔除降低后门攻击对模型的攻击成功率。具体来说我们通过对中文文本进行分词并逐一遍历，逐一从文本删除进行困惑度评估，找到有毒文本中潜在的有害触发器。

主权项：1.一种基于困惑度过滤的中文后门攻击防御方法，其特征在于，包括下列步骤：获取训练语言模型所需的中文数据集；对收集的中文数据集进行预处理；使用中文分词工具对中文文本进行分词；对分词后的文本进行逐一去除；使用大型预训练语言模型对文本进行流畅性评估；将去除个别词的文本的困惑度进行比较，找到潜在有毒触发器的所在的地方；将有毒触发器剔除降低后门训练的攻击成功率。

全文数据：

权利要求：

百度查询：桂林电子科技大学一种基于困惑度过滤的中文后门攻击防御方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种流量控制阀

下一篇：同缆同路由的检测方法、装置、设备及计算机存储介质

相关技术

一种流量控制阀

同缆同路由的检测方法、装置、设备及计算机存储介质

一种用于快速生产面包的组合物及其应用

一种适用于多类型病理图像的自动标注方法及系统

触控方法、装置、电子设备及存储介质

一种数据传输方法、装置、射频串行接口及存储介质

一种用于验证CPU指令模拟执行效果一致性的方法

针刺式固晶机

一种基于BTBC模型的知识图谱构建方法

基于深度表示的风电机组异常检测方法

一种基于图形处理器的三维重建方法、装置及系统

一种智能分布式热源装置

后门相关技术

一种高功率微波后门强耦合参数提取方法及装置_中国工程物理研究院应用电子学研究所_202410291933.4

高功率微波装置数字化仿真后门毁伤效应评估方法及平台_中国工程物理研究院应用电子学研究所_202410034387.6

一种运输车后门_山东通华专用车辆股份有限公司_202420736222.9

一种接地开关与后门的连锁结构_春上集团有限公司_202420453849.3

一种基于谱特征分析的目标检测后门攻击数据检测方法_北京计算机技术及应用研究所_202410992690.7

一种具有防液体撒漏的冷藏车后门框_山东通迈车辆制造有限公司_202420757327.2

术后门静脉血压的确定方法、装置、电子设备及存储介质_东南大学附属中大医院_202410793487.7

一种开关柜后门对接地开关的闭锁装置及开关柜_国网新源集团有限公司_202410994459.1

一种带有前门洞和后门洞的内门环及其模具和汽车侧围_一汽-大众汽车有限公司_202310405426.4

基于声纹识别系统服务拒绝后门的安全性测试方法和装置_浙江大学计算机创新技术研究院_202411091594.1

攻击相关技术

基于保度攻击的社交网络关键人物隐匿方法_浙江工业大学_202111626397.1

一种基于有限信息的掠顶攻击末制导实现方法_西安现代控制技术研究所_202411249469.9

一种基于RPKI路由管控的网络攻击动态防御方法_泉城省实验室_202410438080.2

基于攻击面评估的网络管控方法及装置_北京蔷薇灵动科技有限公司_202411025871.9

一种区块链网络分区攻击检测及防御方法_天津理工大学_202410889699.5

基于球面几何的点云转移攻击方法、装置、设备及介质_厦门理工学院_202411411644.X

一种雨刮攻击角动态测量装置及方法_东风汽车集团股份有限公司_202410975114.1

一种基于攻击吸引力的动态蜜罐调度方法及装置_国网江苏省电力有限公司电力科学研究院_202411281628.3

一种虚拟电厂多阶段APT攻击检测方法_国网湖北省电力有限公司电力科学研究院_202410140257.0

一种基于RPKI可信路由签发体系的网络攻击动态溯源方法_泉城省实验室_202410510814.3

中文相关技术

中文地址加密方法、装置、设备及存储介质_深圳市智慧城市科技发展集团有限公司_202411390819.3

基于改进YOLOv5的中文标注手势识别方法与系统_扬州大学_202111551115.6

中文作文评分方法、装置、电子设备和可读存储介质_成都佳发安泰教育科技股份有限公司_202410949122.9

一种便携式中文汉字书写用面板_太原学院_202323442252.3

一种基于编码器-双解码器的图像中文描述生成方法_上海师范大学_202111419735.4

一种基于依存图解析的一体化中文信息抽取方法及装置_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202411009247.X

一种基于中文分词识别技术的垃圾信息剔除系统及方法_合肥大多数信息科技有限公司_202011391134.2

一种多语义特征协同的中文地址匹配方法_兰州交通大学_202411400842.6

一种中文句法分析方法和系统_中国专利信息中心_202110023058.8

基于多层次自适应语义增强的中文医疗命名实体识别方法和装置_浙江工业大学_202410982954.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于困惑度过滤的中文后门攻击防御方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务