买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉大学
摘要:本发明公开了一种基于目标感知高频增强Transformer网络的目标重识别方法及系统,首先对图像进行傅里叶变换,然后将频率域图像与高通滤波器逐点相乘,对变换后图像进行逆傅里叶变换;再通过块生成模块,将原始图片和高频图片带部分重叠的方式分成若干个小块;把小块展平成序列后,再为原图切块和高频图切块分别添加一个随机初始化小块,然后加上位置信息嵌入,把所有小块输入到Transformer层中;接着在每一代里先学习原图切块得到原始特征,冻结网络层,再将高频切块基于原图注意力指导的学习来获取高频特征;最后恢复网络更新,对高频特征和原始特征分别采用三元组损失和身份损失。本发明有助于Transformer更好的学习动物的轮廓和纹理特征,提高动物重识别检索的准确率。
主权项:1.一种基于目标感知高频增强Transformer网络的目标重识别方法,其特征在于:采用目标感知高频增强Transformer网络来进行目标重识别;所述目标感知高频增强Transformer网络,包括高频图生成模块、块生成模块和深度为h的Transformer模块,其中,h为预设值;所述高频图生成模块,包括傅里叶变换层、高斯高通滤波器和逆傅里叶变换层;所述傅里叶变换,用于对输入原始图像应用傅里叶变换转换到频率域;所述高斯高通滤波器,用于将频率域图像与高通滤波器进行逐点相乘;所述逆傅里叶变换层,用于对应用了高通滤波器的频率域图像进行逆傅里叶变换,将其转换回空间域,输出高频图片;所述块生成模块,包含一个卷积层,展平层,全局特征块添加层和位置信息嵌入层;所述卷积层,采用重叠分割方式以N×N像素为区块分别分割原始图片和高频图片;其中,N为预设值;所述展平层,用于将小块展平成一维序列;所述全局特征块添加层,用于为原始图像和高频图片的序列化小块分别添加一个随机初始化的全局特征块;所述位置信息嵌入层,用于记录每个小块在原始图像中的相对位置;所述Transformer模块,包括一个多头自注意力层MSA以及一个具有GELU激活函数的双层全连接网络MLP,在MSA与MLP前均设置了层级归一化层LayerNorm和加入了残差连接。
全文数据:
权利要求:
百度查询: 武汉大学 基于目标感知高频增强Transformer网络的目标重识别方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。