买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:河南科技学院
摘要:本发明提供了基于Transformer对遥感图像小目标检测的网络模型,用于遥感图像中小目标的检测。首先,本发明采用层次化的Transformer结构和移位窗口计算方式,以处理遥感图像中的尺度变换和像素级别的差异,并提取图像的特征信息。然后,通过引入感受野增强模块并结合ShuffleAttention机制,利用扩张卷积增加小尺度目标的感受野,从而捕捉像素级别和通道依赖关系,提高特征表示能力。最后,采用FocalLoss函数来应对数据类别不均衡问题,以提高网络模型在遥感小目标识别方面的性能。本发明采用SwinTransformer结构,并结合注意力机制,成功实现了对不同尺度目标的建模和长程依赖关系的捕捉,从而增强了对小尺寸目标特征的提取能力,显著提升了基线模型的有效性和鲁棒性。
主权项:1.一种基于Transformer对遥感图像小目标检测的网络模型,其特征在于:包括以下步骤:步骤S1:对于输入的RGB图像,采用划分模块进行不重叠分块和重组操作,将整幅图像划分为不同的块集合,对每个块进行重组操作,将其沿着通道方向展平为大小为4×4×3的向量;步骤S2:通过SwinTransformer结构的四个特征学习阶段,分别提取不同分辨率下的特征信息,逐层扩大感受野;步骤S2.1:利用线性嵌入层模块对通道维度的数据进行线性变换来进行特征提取,将48维的图像特征映射到128维,增加特征的维度,从而提高网络对图像特征的表达能力和表示能力;步骤S2.2:通过两个SwinTransformerBlock模块进行注意力计算,从映射过来的特征中提取大小为H4×W4×C的特征信息,以获得更为精细的小目标特征,以保持特征的准确性和丰富性;步骤S2.3:利用图片融合模块进行特征下采样操作,将特征图的宽高减半,同时将维度扩展一倍,有助于将不同层次的特征进行融合,以提升整个特征金字塔的表达能力和鲁棒性;步骤S3:结合自注意力机制,对SwinTransformer主干网络提取到的不同尺度信息构成特征金字塔,将不同层结构通过残差运算组合在一起。
全文数据:
权利要求:
百度查询: 河南科技学院 一种基于Transformer对遥感图像小目标检测的网络模型
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。