恭喜无锡学院单慧琳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜无锡学院申请的专利一种基于多尺度深度监督的高分辨遥感图像语义分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119559403B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510132150.6,技术领域涉及:G06V10/26;该发明授权一种基于多尺度深度监督的高分辨遥感图像语义分割方法是由单慧琳;王兴涛;张银胜;孟祥源;吴心悦;马丁设计研发完成,并于2025-02-06向国家知识产权局提交的专利申请。
本一种基于多尺度深度监督的高分辨遥感图像语义分割方法在说明书摘要公布了:本发明提供了一种基于多尺度深度监督的高分辨遥感图像语义分割方法,包括以下步骤:步骤1,获取ISPRSPotsdam数据集和Vaihingen数据集;步骤2,搭建多尺度深度监督网络MDSNet,包括空间分支、语义分支网络和多尺度特征聚合部分;所述空间分支、语义分支网络和多尺度特征聚合部分均为四层结构;步骤3,将训练集输入至多尺度深度监督网络MDSNet中训练,计算损失函数并进行反向传播,更新网络参数,获取训练好的参数模型;步骤4,将测试集输入到训练好的参数模型中,输出目标图像的分割图。本发明提出的方法在提高特征提取能力的同时,提高了语义分割的准确率,以及训练效率和稳定性。
本发明授权一种基于多尺度深度监督的高分辨遥感图像语义分割方法在权利要求书中公布了:1.一种基于多尺度深度监督的高分辨遥感图像语义分割方法,其特征在于,包括以下步骤:步骤1,获取ISPRSPotsdam数据集和Vaihingen数据集,对数据集进行统一预处理后划分为训练集、验证集和测试集;步骤2,搭建多尺度深度监督网络MDSNet,包括空间分支、语义分支网络和多尺度特征融合部分;所述空间分支、语义分支网络和多尺度特征融合部分均为四层结构;步骤3,将训练集输入至多尺度深度监督网络MDSNet中训练,计算损失函数并进行反向传播,更新网络参数,获取训练好的参数模型;步骤4,将测试集输入到训练好的参数模型中,输出目标图像的分割图;步骤2包括:所述空间分支包括四层空间去冗余残差模块,四层空间去冗余残差模块的输出由浅至深为S1,S2,S3和S4,空间去冗余残差模块的输出是B×A×H×W四维特征,其中B为批大小、A为通道数、H为长、W为宽;第二层空间去冗余残差模块的通道数比第一层空间去冗余残差模块的通道数扩大一倍,长和宽缩小一倍;第三层空间去冗余残差模块的通道数比第二层空间去冗余残差模块的通道数扩大一倍,长和宽缩小一倍;第四层空间去冗余残差模块的通道数比第三层空间去冗余残差模块的通道数扩大一倍,长和宽缩小一倍;将S2,S3和S4进行通道重新加权连接,根据不同特征图的可学习参数判断每个通道数的差异程度,动态调整通道的重要性,最后将通道重新加权连接的输出M4作为多尺度特征融合部分中第四层输入;步骤2还包括:所述语义分支网络包括四层残差注意力Mamba,残差注意力Mamba用于细粒度特征的提取,残差注意力Mamba包括残差Transformer和Mamba,四层残差注意力Mamba的输出由浅至深为C1,C2,C3和C4,通道数与长宽变化与空间分支一致;在空间分支和语义分支之前采用双层卷积块进行特征的粗略提取,每层卷积块中包含一次常规卷积、批归一化和ReLU激活函数;所述多尺度特征融合部分包括大内核分组特征提取模块与多尺度卷积注意模块,其中,大内核分组特征提取模块用于将空间分支输出S、上采样和通道重新加权输出M和语义分支输出C三类特征进行选择性融合提取,大内核分组特征提取模块将特征映射与注意系数逐步结合起来,通过引入分组卷积整合来自浅层和深层的特征;将分组卷积后的特征进行批归一化,并进行特征融合,之后对特征融合结果进行普通卷积,并与初始的空间分支输出S和语义分支输出C进行拼接,最后送入多尺度卷积注意模块中;将空间分支和语义分支网络输出的特征采用四层多尺度卷积特征融合模块与三层高效上采样卷积块连接,三层高效上采样卷积块的输出由浅至深依次为M1,M2和M3,将每一层多尺度卷积特征融合模块的输出输入分割头,进行分割,分割头包括一次3×3卷积核的普通卷积块、一次1×1卷积核的普通卷积和一次上采样;分割头有四层,对应四层多尺度卷积特征融合模块;步骤3包括:将特征维度为b×3×256×256的遥感图像送入多尺度深度监督网络MDSNet中,其中b为batch_size,batch_size表示一个批次训练的图像总数;3表示为通道数;将遥感图像送入双层卷积块中,输出特征维度变为b×64×256×256,完成对原始图像特征的粗略提取;将双层卷积块的输出送入空间分支与语义分支网络中;对于空间分支,所述第一层空间去冗余残差模块包括左半部分和右半残差部分,其中,所述左半部分包括为水平垂直卷积,所述右半残差部分为残差结构;先将b×64×256×256的特征进行水平垂直卷积,卷积核分别为3×1、3×3和1×3,并将3×1、3×3和1×3三次不同卷积核的卷积结果拼接生成大小为b×192×128×128的四维特征;将包含方向特征的四维特征送入第一层空间去冗余残差模块的右半残差部分,四维特征分别送入去除ReLU的卷积块、去除ReLU的坐标卷积块,去除ReLU的卷积块和去除ReLU的坐标卷积块卷积核分别为1×1和3×3,输出结果均为b×64×128×128的四维特征,将去除ReLU的卷积块的结果输入小波变换卷积中,小波变换卷积的卷积核为5×5,输出结果为b×64×128×128的四维特征,最后将去除ReLU的卷积块、去除ReLU的坐标卷积块和小波变换卷积的输出四维特征相加,并经过一次ReLU激活函数,得到结果为b×64×128×128的四维特征S1;所述去除ReLU的坐标卷积块包括坐标卷积和批归一化;第二、第三与第四层空间去冗余残差模块的处理过程与第一层空间去冗余残差模块相同,输出结果分别为b×128×64×64的四维特征S2、b×256×32×32的四维特征S3与b×512×16×16的四维特征S4,具体公式为:F1=fconcatCBR1×3CBR1×1,CBR3×1CBR1×1,CBR3×3CBR1×1FSDCM=ReLUfconcatCB1×1F1,WTcon2d5×5CB1×1F1,CoCB3×3CoCBR3×3F1其中F1为特征表现力增强后的结果,FSDCM为空间去冗余残差模块的输出结果;fconcat·为拼接操作,CBRn×m为卷积块,包含n×m大小卷积核的常规卷积、批归一化和ReLU激活函数;ReLU·为激活函数,CBn×m为去除ReLU激活函数的卷积块,WTcon2dm×m为m×m大小卷积核的小波变换卷积;CoCBRm×m为坐标卷积块,包含m×m大小卷积核的坐标卷积、批归一化和ReLU激活函数;CoCBm×m为去除ReLU激活函数的坐标卷积,其中m和n为正整数;多尺度深度监督网络MDSNet采用最后面的三层特征提取层输出S2,S3,S4进行特征融合,对输入特征M4以S4的标准进行上采样,将上采样后的特征图按照第一维度进行拼接,得到拼接后的特征图,通过将输入特征的通道数相加,设置一个具有相同通道数的可学习权重参数,并对可学习权重参数进行归一化,将拼接后的特征图与归一化后的权重参数相乘,实现输入特征的加权操作,得到加权特征,将加权特征进行拼接,并通过步长为4,卷积核为4×4的卷积操作得到b×512×16×16的四维特征M4;对于语义分支网络,残差注意力Mamba包括残差Transformer和Mamba,残差Transformer通过自注意力机制,直接建模输入图像的全局关系,从而捕获长距离的依赖性;残差Transformer包括高效注意力块ETB,高效注意力块ETB采用高效多头自注意力机制求取注意力分数,将双层卷积块的结果输入残差Transformer中,输出结果为b×64×128×128的四维特征,公式为: FFNx=σxW1+b1W2+b2 其中EMSAQ,K,V为高效多头自注意力的输出,Q表示查询向量,K表示关键向量,V表示数值向量,EMSALinearx表示经过全连接层的高效多头自注意力机制,IN·为实例规范化,Conv·为卷积核为1×1的卷积,T表示转置;FFNx为全连接前馈网络层,x为输入特征;W1,W2是线性变换的权重矩阵;b1,b2是偏置项,σ是非线性激活函数,为高效多头自注意力的残差连接结构;Linear·为全连接层;y为残差Transformer的最终输出;残差Transformer对全局语义特征进行提取后,将y输入第一层残差注意力Mamba的视觉状态空间VSS模块中,对y进行局部语义特征提取,VSS模块包括状态空间模块SSM,将残差Transformer的输出结果输入残差注意力Mamba中,得到b×64×128×128的四维特征C1,第二、三与四层残差注意力Mamba的处理过程与第一层残差注意力Mamba相同,输出结果分别为b×128×64×64的四维特征C2、b×256×32×32的四维特征C3与b×512×16×16的四维特征C4,具体公式为:X1=SiluLinearLNyX2=LNSSMSiluDWConvLinearLNx 其中LN·表示层归一化,Silu·表示Silu函数激活操作,X1与X2分别为Silu函数的输出和LN层归一化的输出;DWConv·为深度可分离卷积,为乘积操作,XVSS为残差注意力Mamba最终输出结果;最后,将S1、S2、S3、S4和C1、C2、C3、C4,M4一同送入多尺度特征融合部分中,第四层多尺度特征融合的输入为S4、C4和M4,将三个四维特征S4、C4和M4送入大内核分组特征提取模块中,每一个输入经过一次卷积核为3×3的组卷积与批归一化,均输出b×256×16×16的四维特征,再将S4、C4和M4经过组卷积和批归一化的结果进行拼接,并经过ReLU激活函数、去除ReLU的卷积块和Sigmoid操作,输出结果为b×1×16×16的特征,最后将b×1×16×16的特征与S1、C1进行哈达玛积,输出b×512×16×16的四维特征,最后将b×512×16×16的四维特征输入多尺度卷积注意模块,得到b×512×16×16的四维特征M3,作为第三层多尺度特征融合的输入,第三、二、一层的多尺度特征融合过程与第四层多尺度特征融合过程相同,第三、二、一层的多尺度特征融合输出结果分别为b×256×32×32的四维特征、b×128×64×64的四维特征、b×64×128×128的四维特征;将多尺度特征融合结果分别送入分割头中,输出结果均为b×6×256×256的四维特征,6代表着分割的六个类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人无锡学院,其通讯地址为:214105 江苏省无锡市锡山区锡山大道333号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。