一种面向分割学习的模型后门攻击脆弱性分析方法和系统

导航：龙图腾网> 最新专利技术> 一种面向分割学习的模型后门攻击脆弱性分析方法和系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江大学

摘要：本发明公开了一种面向分割学习的模型后门攻击脆弱性分析方法和系统，属于人工智能安全领域。收集图像分类模型在分割学习过程中由客户端底层模型发送至服务器端中间模型的第一中间层表示，结合辅助数据集迭代训练底层替代模型；利用第一中间层表示训练聚类器，获取聚类类别到真实类别的映射关系，得到锚点；基于统计思想获取与图像触发器对应的中间层表示触发器；基于中间层表达形式的锚点替换目标类样本的后门攻击方法，向中间模型注入后门并训练；利用测试样本检测图像分类模型的后门攻击成功率，获得模型后门攻击脆弱性。本发明综合考虑了攻击测试方法的成功率和隐蔽性，可以更加全面的暴露模型在分割学习框架下的漏洞，推动防御技术的发展。

主权项：1.一种面向分割学习的模型后门攻击脆弱性分析方法，其特征在于，包括以下步骤：（1）将待进行后门攻击脆弱性分析的图像分类模型分割为底层模型、中间模型和顶层模型，所述中间模型部署在服务器端，底层模型和顶层模型部署在本地客户端；（2）收集图像分类模型在分割学习训练过程中由客户端底层模型发送至服务器端中间模型的第一中间层表示，利用收集的第一中间层表示与辅助数据集迭代训练底层替代模型；（3）利用收集的第一中间层表示训练聚类器，通过辅助数据集的聚类结果和真实标签获取聚类类别到真实类别的映射关系，将后门攻击目标类别的聚类中心作为锚点；（4）基于统计思想获取与图像触发器对应的中间层表示触发器；包括：（4-1）向所有的辅助数据集样本中加入图像触发器，获得带触发器的辅助数据集；（4-2）将带触发器的辅助数据集输入到训练后的底层替代模型中，获取带触发器的第一替代中间层表示；以及，将不带触发器的辅助数据集输入到训练后的底层替代模型中，获取不带触发器的第一替代中间层表示；（4-3）计算同一辅助数据集样本对应的带触发器的第一替代中间层表示和不带触发器的第一替代中间层表示在每一个中间层表示位上的差异，将所有样本在同一位上的差异累加，取差异累加值最大的若干位作为触发位置；（4-4）计算辅助数据集样本的第一替代中间层表示在每一个中间层表示位上的均值，取触发位置的均值作为触发器数值；（4-5）结合触发位置和触发器数值得到中间层表示触发器；（5）基于中间层表达形式的锚点替换目标类样本的后门攻击方法，向服务器端中间模型注入后门并训练，修改服务端中间模型；包括：（5-1）设置服务器端中间模型的后门注入轮数和每一个轮次包含的后门注入批次；（5-2）在每一个训练批次中，选择一定数量的步骤（2）收集的第一中间层表示，结合中间层表示触发器，对服务器端中间模型进行后门注入训练，更新中间模型，所述的后门注入训练具体包含两阶段训练过程：选择一个训练批次的收集的第一中间层表示；在第一阶段训练过程中，保留服务端中间模型的副本，记为副本模型，向收集的第一中间层表示中加入中间层表示触发器，获得带触发器的第一中间层表示；计算带触发器的第一中间层表示输入服务端中间模型后生成的第二中间层表示与锚点之间的损失，根据损失结果计算相应的梯度，更新中间模型；在第二阶段训练过程中，将不带触发器的收集的第一中间层表示分别输入到第一阶段更新后的中间模型和副本模型，得到两个第二中间层表示，计算两个第二中间层表示之间的损失，根据损失结果计算相应的梯度，更新中间模型；（5-3）迭代多个训练批次完成一轮训练；（5-4）经历若干轮训练后得到最终修改后的服务端中间模型；（6）利用测试样本检测图像分类模型的后门攻击成功率，判断图像分类模型的后门脆弱性，后门攻击成功率越高，说明图像分类模型在分割学习中的后门脆弱性越高。

全文数据：

权利要求：

百度查询：浙江大学一种面向分割学习的模型后门攻击脆弱性分析方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：独立站数据定向同步方法及其装置、设备、介质

下一篇：一种PCF板的连接结构及其使用方法

相关技术

独立站数据定向同步方法及其装置、设备、介质

一种PCF板的连接结构及其使用方法

一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

一种冰孔约束下水下航行体出水试验装置及试验方法

一种发动机选配零件装配过程人机交互防错装置及方法

一种双层基质与立体模式的茶树种质资源保存和快速繁育方法

一种磷酸铈钴锂改性类单晶富锂锰基正极材料的制备方法及其产物

一种形貌可控的纳米硼化钴粉体及其制备方法

一种导热系数低的复合墙体保温砌块及其制备方法

超临界晶圆清洗/干燥介质回收方法以及系统

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

一种高速砂尘温控系统

攻击相关技术

一种虚拟电厂的APT攻击检测方法_陕西思极科技有限公司_202411154294.3

一种后门攻击方法和防御方法_华中科技大学_202311273829.4

一种基于多触发的说话人验证技术的后门攻击方法_西北工业大学_202410909561.7

一种基于红外障碍模拟信号的智能无人机攻击方法_北京理工大学_202410728119.4

一种抗推理攻击的隐私保护信息匹配方法及装置_华中科技大学_202111222987.8

基于成员推理攻击的医疗数据风险等级分类系统及方法_浙江大学_202410947396.4

一种针对车牌识别系统的毒药攻击测试方法_山东智和创信息技术有限公司_202410656552.1

周期型拒绝服务攻击下信息物理系统事件触发安全控制方法_哈尔滨工业大学_202410679281.1

基于ATT&CK知识图谱的攻击链生成方法和装置_长扬科技(北京)股份有限公司_202410084091.5

社交媒体攻击言论检测模型两阶段建模方法、装置及介质_华南理工大学_202410554852.9

后门相关技术

一种后门攻击方法和防御方法_华中科技大学_202311273829.4

一种针对图数据的联邦学习后门攻击方法_杭州电子科技大学_202410822810.9

一种基于多触发的说话人验证技术的后门攻击方法_西北工业大学_202410909561.7

一种基于困惑度过滤的中文后门攻击防御方法_桂林电子科技大学_202410772942.5

一种面向分割学习的模型后门攻击脆弱性分析方法和系统_浙江大学_202410781553.9

边缘设备功能协议后门检测及恶意样本库架构模型_李炎炎_202410607318.X

多类型映射的神经网络后门风险评估方法、系统及设备_武汉大学日照信息技术研究院_202210598454.8

一种具有防脱落结构的车厢后门板挂架_湖北郧凯专用车有限公司_202323395850.X

一种汽车后门外装饰板的双色注塑模具_慈溪市盛艺模具有限公司_202410961629.6

一种基于双网协同训练的DNN后门消除方法_浙江工业大学_202410334585.4

模型相关技术

一种积分模型_晋中职业技术学院_202420672550.7

建筑信息模型管理系统_南通职业大学_202410946875.4

模型推理方法及装置_上海壁仞科技股份有限公司_202410980431.2

一种模型测试方法、装置和用于模型测试的装置_北京搜狗科技发展有限公司_202110688290.3

三维人脸几何模型、人脸彩色模型的构建方法、装置_西安科技大学_202210927602.6

基于BERT模型的医学应用模型训练方法及装置_北京诺道认知医学科技有限公司_202011159163.6

一种判别式语言模型的模型调整方法及装置_清华大学_202210567681.4

图像生成模型、图像生成模型的训练方法及装置_维沃移动通信有限公司_202410812014.7

一种基于生成模型与判别分类模型的图像半监督分类方法_南通大学_202210855415.1

模型设定支援装置、模型设定支援方法及存储介质_本田技研工业株式会社_202410204794.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种面向分割学习的模型后门攻击脆弱性分析方法和系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务