一种内含感知增强模块的Swin Transformer自适应图像融合方法

导航：龙图腾网> 最新专利技术> 一种内含感知增强模块的Swin Transformer自适应图像融合方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学

摘要：本发明公开了一种内含感知增强模块的SwinTransformer自适应图像融合方法，其特点在于对可见光图像根据场景环境进行优化增强，并采用自适应融合策略实现图像融合。该方法实现步骤为：1根据实际的场景条件，结合红外图像特征对可见光图像进行优化增强；2对优化后的可见光图像与输入的红外图像使用卷积操作获得低层特征图，并通过嵌入编码得到特征向量；3利用基于SwinTransformer的特征提取模块获取图像的全局语义信息，生成高层特征图；4利用自适应融合策略融合两种源图像的特征图；5通过卷积层和SwinTransformer模块精细化地逐次还原图像的高级和低级语义特征，实现图像重构。本发明方法无需人工干预，能够得到期望约束下的最佳策略。

主权项：1.一种内含感知增强模块的SwinTransformer自适应图像融合方法，其特征在于，包括如下步骤：步骤1：可见光图像感知增强；利用感知增强模块PEM提高可见光图像的质量；步骤2：低级语义特征提取；将预处理后的可见光图像和原始的红外图像通过三次连续卷积得到低层特征图；步骤3：高级语义特征提取；将低层特征图进行嵌入编码以展平高、宽维度，生成符合SwinTransformer处理要求的序列向量：其中，表示编码后的输入序列，Reshape.表示图像变换操作；将序列向量送入2个基于SwinTransformer的特征提取模块ESTB中，获取图像的全局上下文；每个ESTB模块由6个SwinTransformer层组成；在通过两个ESTB模块后，对高级语义特征进行归一化处理，并将其形状重新变换成特征图矩阵：其中为图像高级语义特征，为形状变换后的高层特征图；UnReshape.图像变换操作；步骤4：自适应特征融合；编码器完成图像特征提取后，将红外和可见光特征图输入交叉自注意力CMSA模块中；该模块同时接收来自两种源图像的特征图，针对其中一个源图像的特征图，根据自身得到查询矩阵Q，而根据另一个源图像的特征图得到键矩阵K和值矩阵V，进行自注意力计算；其中，为交叉注意力计算完成后的源图像各自的特征图，CMSA中包含2层STB，用于得到两张源图像的全局关联特征；输出的交互特征图将被作为两个分支的输入，其中一个分支在经过卷积层特征增强后，将两个源图像的特征图进行通道拼接；随后，经过三个卷积层将通道数降到原始通道数，完成局部信息融合；另一分支则直接拼接，经过一个卷积层降维融合后输入FSTB实现全局特征增强，完成全局信息融合；最后，将局部融合信息和全局融合信息相加得到融合后的特征图：其中与分别表示局部融合信息和全局融合信息，Conv表示卷积操作，Cat为拼接操作，将两张特征图的通道维度直接拼接；FSTB为融合自注意力层，包含6层STB，用于增强融合后图像的全局特征；步骤5：图像重构；利用Transformer模块和基于CNN的解码器，将融合后的深度特征映射回图像空间；首先，将融合图像的特征图输入基于SwinTransformer的解码器模块RSTB中，精细化融合特征图中的高级语义特征，并从全局角度恢复融合的低级语义特征；接着，通过卷积减少融合特征图的通道数量，生成最终的融合图像；步骤6：模型训练；对于自编码器结构的图像融合算法，训练分成两个阶段；第一阶段，训练自编码器，即先训练编码器和解码器，使模型具有提取图像信息和重构图像的能力；在第一阶段训练完成后，固定编码器和解码器的参数，训练融合策略和感知增强模块，以实现完整的图像融合算法；整个过程采用端对端的训练；步骤7：测试验证：已训练好的模型通过测试数据集检验，根据含有不同挑战因素场景下的测试数据集得到融合结果的主客观指标评价来验证模型的有效性。

全文数据：

权利要求：

百度查询：西北工业大学一种内含感知增强模块的Swin Transformer自适应图像融合方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于电子器件的材料

下一篇：火电机组中锅炉一次调频能力的状态观测方法、装置、介质及产品

相关技术

用于电子器件的材料

火电机组中锅炉一次调频能力的状态观测方法、装置、介质及产品

一种铝管内外径阳极氧化表面处理工艺

一种新型发光车标及成型工艺

一种带自动锁闭口盖的脱插整流罩结构

基于边缘检测的支持装置视角检测及图像智能采集方法

一种废旧圆柱形锂电池回收设备

一种电容后置温度补偿方法、装置、电子设备及存储介质

一种升压变/换流变压器可靠性评价方法

船舶的自动控制水雾抑爆系统及方法

防渗材料、其制备方法及应用

一种用于提高同步IO并行访问效率的加速结构和方法

Swin相关技术

一种基于Swin Transformer的脑肿瘤图像自动分类方法和系统_长春理工大学_202410657765.6

一种基于Swin Transformer和CNN双分支耦合的图像配准方法_南京理工大学_202210650873.1

一种基于Swin-Transformer的突然电离层骚扰事件预报方法_中国电波传播研究所(中国电子科技集团公司第二十二研究所)_202410740195.7

一种基于改进Swin Transformer的生成对抗网络水下图像增强模型_江苏海洋大学_202410657609.X

一种基于改进注意力的Water-Res-Swin遥感图像水体分割方法_淮阴工学院_202410776988.4

基于多方向频带的Swin Transformer的图像分类方法_西安理工大学_202410635993.3

一种基于改进Swin Transformer的砂岩显微图像分类方法及系统_东北石油大学_202410562542.1

一种基于Swin Transformer的东巴文检测方法_西南大学_202410505468.X

一种耦合双三次插值法和Swin Transformer的GOSAT XCO₂数据重建方法_长江三峡技术经济发展有限公司_202410395176.5

一种基于改进Swin Transformer的车标识别方法_上海昊启信息科技有限公司_202410368518.4

Transformer相关技术

基于CNN-Transformer的DAS去噪方法_南京大学_202311310501.5

基于Transformer和联邦学习的流量预警方法_中电信数智科技有限公司_202210485501.8

一种基于Transformer的图像去水印方法及系统_广州大学_202410774192.5

基于多尺度transformer的低照度相衬细胞显微图像增强方法_华侨大学_202410899763.8

一种内含感知增强模块的Swin Transformer自适应图像融合方法_西北工业大学_202410771519.3

基于Transformer时序预测模型的网络运行指标预测方法及系统_南昌大学_202410584760.5

基于多头多层次特征稀疏transformer的新生儿疼痛表情识别方法_南京邮电大学_202410809193.9

基于Transformer的基因组预测方法_河南大学_202410666750.6

基于频域门控Transformer网络的地震数据重建方法_河北工业大学_202410902723.4

一种基于Swin Transformer的脑肿瘤图像自动分类方法和系统_长春理工大学_202410657765.6

模块相关技术

光模块_青岛海信宽带多媒体技术有限公司_202280049621.1

充电模块_广东电网有限责任公司_202410747958.0

相机模块_LG伊诺特有限公司_202210036741.X

电池模块_丰田自动车株式会社_202410199765.6

电池模块、包括电池模块的电池组和制造电池模块的方法_株式会社LG新能源_202180005487.0

连接器模块和包括该连接器模块的电池模块_株式会社LG新能源_202380020371.3

光模块中光信号监控方法及光模块_深圳市力子光电科技有限公司_202410689252.3

片式天线模块阵列和片式天线模块_三星电机株式会社_202010423036.6

模块化框架_和硕联合科技股份有限公司_202110612892.0

IGBT模块防护装置_深圳市创高科技有限公司_202322852559.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种内含感知增强模块的Swin Transformer自适应图像融合方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务