基于注意力扰动的图像自动标注方法、系统和介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华南理工大学

摘要：本发明公开了基于注意力扰动的图像自动标注方法、系统和介质，方法包括下述步骤：将待标注数据集划分为有标签数据集和无标签数据集，对有标签数据集进行图像增强以扩充数据集，并使用对应标签进行标注；构建基于注意力扰动机制的生成对抗网络，所述生成对抗网络包括图像自编码器、生成器和判别器；使用待标注数据集迭代训练生成对抗网络，同时使用扩充后的有标签数据集优化判别器的多任务全连接分类网络；使用训练好的判别器对无标签的待标注图像进行分类标注。本方法构建基于注意力扰动机制的生成对抗网络，同时引入多任务全连接分类网络，通过对抗训练，优化了图像特征表示，实现了图像的自动标注，提升了图像生成的多样性和质量。

主权项：1.基于注意力扰动的图像自动标注方法，其特征在于，包括下述步骤：根据待标注数据集是否拥有对应标签，将待标注数据集划分为有标签数据集和无标签数据集；对有标签数据集进行图像增强以扩充数据集，并使用对应标签进行标注；构建基于注意力扰动机制的生成对抗网络，所述生成对抗网络包括图像自编码器、生成器和判别器；所述图像自编码器用于实现真实图像的重构；所述生成器中加入注意力扰动机制，用于产生图像的伪标签；所述判别器引入多任务全连接分类网络，用于预测图像具体类别；使用待标注数据集迭代训练生成对抗网络，同时使用扩充后的有标签数据集优化判别器的多任务全连接分类网络；使用训练好的判别器对无标签的待标注图像进行分类标注；所述图像自编码器包括图像编码模块和图像解码模块，均有4层卷积层，对输出进行批归一化处理，采用ReLU激活函数；所述图像编码模块中的图像编码器用于对输入图像进行PCA来获取特征编码，所述图像解码模块中的图像解码器用于将图像的特征编码解码为生成器的输入；所述生成器依次包括3层连续卷积层、注意力扰动层和最后一层卷积层；输入的图像特征编码通过3层连续卷积层获得特征张量，并在输出前进行批归一化处理，使用ReLU激活函数计算激活值，将特征张量输入注意力扰动层进行注意力扰动，获得输出张量和伪标签；将输出张量输入最后一层卷积层进行卷积操作获得生成图像；所述进行注意力扰动具体为：使用三层独立的卷积层对输入的特征张量进行维度变换，得到输入特征张量的三个不同维度表示，记为Q、K、V；随机选取输入的特征张量，从选中特征张量的三个不同维度表示中选取两个进行交换，得到转换后的表示Qt、Kt、Vt；使用Qt、Kt、Vt计算特征张量的注意力图，乘以权重变量σ后与特征张量相加作为扰动后的输出张量；对未被选中的未扰动输出张量设置值为1的伪标签；对选中的扰动后输出张量，根据Qt、Kt、Vt设置值为2～4的伪标签；所述独立卷积层的卷积核大小为1×1，输出通道数与输入的特征张量保持一致；所述判别器包括4层连续卷积层、多任务全连接分类网络和1层全连接层；所述卷积层采用ReLU激活函数；所述多任务全连接分类网络由扰动分类层与图像分类层组成，所述1层全连接层为图像真假判别层；输入的图像通过4层连续卷积层映射为判别器隐空间中的特征张量，再通过重构操作将特征张量拉伸为向量用作多任务全连接分类网络和全连接层的输入，其中，图像真假判别层输出为1维向量，表示输入图像的真实程度预测；扰动分类层输出为4维向量，表示输入图像的伪标签预测；图像分类层输出为n维向量，表示输入图像的类别预测，n为待标注数据集中包含图像的具体类别数量。

全文数据：

权利要求：

百度查询：华南理工大学基于注意力扰动的图像自动标注方法、系统和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种市政道路铺砖装置

下一篇：一种微透镜准分子激光导管和微透镜微焦成像一体化装置

相关技术

一种市政道路铺砖装置

一种微透镜准分子激光导管和微透镜微焦成像一体化装置

一种用于支持北斗定位和陆基导航定位的手持天线设备

一种便于安装的电力计量装置

一种金属制品加工用数控刀头

一种非封闭交通条件下基于动应变的桥梁承载能力评定方法及系统

电池充电时长确定方法、确定装置以及电池管理系统

一种移动医疗推车

具有处于低速档的分动箱的混合动力的动力总成系统和操作

一种切菜器

一种电驱机械振动辅助负压可弯导引鞘

回环检测方法、装置、电子设备和存储介质

自动相关技术

集自动理袋、自动升降、自动热合于一体的封口装置_漳州青牛科技有限公司_202323530394.5

自动配药器_浙江理工大学_201910792564.6

自动层析柱_江苏汉邦科技股份有限公司_202410927877.9

自动上料机_深圳悦和精密技术有限公司_202420410032.8

自动驾驶车辆_上海易咖智车科技有限公司_202420478325.X

自动接电装置_宜兴赛弗冶金机械有限公司_202323575951.5

自动卸料装置_中交机电工程局有限公司_202410167345.X

自动脱模机_包头市公路建设开发有限责任公司_202421965120.0

自动理疗设备_台州市瀚维数康智能制造有限公司_202323265103.4

自动选配装置_中国第一汽车股份有限公司_202410673972.0

标注相关技术

标识信息的标注方法及装置、存储介质及电子装置_浙江大华技术股份有限公司_202110853414.9

基于涂鸦标注的弱监督的两阶段医学图像分割方法及装置_吉林大学_202410758130.5

基于依赖注意力图卷积的政务数据自动标注方法及系统_山东省大数据中心_202411109891.4

连续帧点云的4D自动标注方法、系统、设备及介质_武汉极目智能技术有限公司_202410755316.5

多病种诊疗路径辅助标注方法、系统、设备及存储介质_四川久远银海软件股份有限公司_202411111855.1

图像标注处理方法、装置、计算机设备及可读存储介质_腾讯科技(深圳)有限公司_202310246891.8

多平台图像数据的数据标注自动流转处理方法及处理系统_重庆长安汽车股份有限公司_202111508593.9

一种基于微调视觉大模型的隧道病害分割及标注方法_云南云路工程检测有限公司_202411087834.0

基于数据标注学习机制的视频清晰度和亮度检测方法_山东大学_202210030420.9

一种CT图像的标注处理方法及装置_河池市第一人民医院_202410890715.2

方法相关技术

拼接处理方法、显示方法及装置_北京嗨动视觉科技有限公司_202410789924.8

焊接方法_华为技术有限公司_202310265226.3

防滑刹车系统、控制方法、余压故障告警方法及处置方法_成都飞机工业(集团)有限责任公司_202410495891.6

应用风险指数生成方法、模型构建方法、检测方法及设备_武汉安天信息技术有限责任公司_202310222148.9

模具模拟方法、模具补偿设计方法以及模具加工制作方法_中信戴卡股份有限公司_202411020603.8

封装方法_立锜科技股份有限公司_202310232492.6

刻蚀方法_中微半导体设备(上海)股份有限公司_201911358929.0

主动降噪系统及其失稳检测方法、控制方法、设备_宁波方太厨具有限公司_202411080503.4

参考信号的发送方法,接收方法和装置_华为技术有限公司_202310260761.X

视频解码方法、视频编码方法和装置_三星电子株式会社_202410898515.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于注意力扰动的图像自动标注方法、系统和介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务