买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华南理工大学
摘要:本发明公开了一种基于UMamba的水壶缺陷语义分割检测系统及方法,属于数据处理技术领域,其系统包括图片预处理模块、Vision‑Swin‑UMamba编码器和Vision‑Swin‑UMamba解码器;其方法包括:获取水壶内胆缺陷所需要用到的图片并经过预处理后得到图像块;利用Vision‑Swin‑UMamba编码器对图像块进行下采样得到下采样输出特征;利用Vision‑Swin‑UMamba解码器对下采样输出特征进行上采样;所述基于UMamba的水壶缺陷语义分割检测系统及方法解决了传统的语义分割的准确度不高的问题。
主权项:1.一种基于UMamba的水壶缺陷语义分割检测系统,其特征在于:包括图片预处理模块、Vision-Swin-UMamba编码器和Vision-Swin-UMamba解码器;所述图片预处理模块用于获取水壶内胆缺陷所需要用到的图片,并对图片尺寸和物体框统一缩放到固定尺寸和对图片进行归一化处理得到图像块;所述Vision-Swin-UMamba编码器用于对图像块进行下采样得到下采样输出特征;所述Vision-Swin-UMamba解码器用于对下采样输出特征进行上采样;其中Vision-Swin-UMamba编码器和Vision-Swin-UMamba解码器均通过在视觉Mamba块引入状态空间模型和卡尔曼滤波神经网络得到,以使Vision-Swin-UMamba编码器沿着四个扫描方向展开图像块,创建四个不同的序列,以使Vision-Swin-UMamba解码器合并下采样输出特征以形成完整的2D特征图的缺陷结果图片;所述Vision-Swin-UMamba解码器使用具有密集跳跃连接的U形架构来构建,已通过U形架构利用跳跃连接来恢复低级细节,并采用编码器-解码器的结构来提取高级信息;Vision-Swin-UMamba解码器上采样块为视觉曼巴块和图像块扩展,给定来自阶段l上采样快的跳跃连接特征和来自上一个上采样块的特征,第l个上采样块的输出特征和阶段l的分割图的表述为: ,,,=;其中,表示特征拼接操作,表示第l阶段的转置卷积,表示带有1x1卷积的分割头,用于将特征从维度d投影类别数K;和分别表示第l阶段特征图的高度和宽度;和是第l阶段带有残差连接的两个卷积块,每个和都由两个带有LeakyReLU激活的卷积层组成;所述Vision-Swin-UMamba编码器包括依次连接的五个阶段处理器;第一阶段处理器包括一个卷积层,用于两次下采样,并在卷积层之后采用2D实例归一化;第二阶段处理器通过具有2×2块大小的块嵌入层将图像块的特征分辨率保持在1;第二阶段处理器至第五阶段处理器的视觉状态空间块的数量均为2;每个阶段处理器都进行2次下采样,每个阶段处理器均由用于2个下采样的图像块合并层和用于高级特征提取的多个视觉Mamba块组成,其中,通过ImageNet预训练的权重来初始化视觉曼巴块和补丁合并层;所述第一阶段处理器的内核为77,填充大小为3,步长为2;每个阶段处理器输出的特征尺寸为其前一阶段处理器输出的特征尺寸的两倍,以使五个阶段处理器的通道数分别为48、96、192、384和768;所述Vision-Swin-UMamba编码器用于对图像块进行下采样得到下采样输出特征的公式为:,v,;其中是四个不同扫描方向,expand是状态空间模型的图像块扩展,S6是选择性扫描空间状态顺序模型,为图像块的输入特征,为下采样输出特征;所述Vision-Swin-UMamba解码器用于对下采样输出特征进行上采样的公式为:;其中是四个不同扫描方向,merge是状态空间模型的图像块合并,1,2,3和4为下采样输出特征,为上采样输出特征。
全文数据:
权利要求:
百度查询: 华南理工大学 基于UMamba的水壶缺陷语义分割检测系统及方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。