首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于金字塔型视觉Transformer的伪装目标检测方法和系统_浙江大学_202410351640.0 

申请/专利权人:浙江大学

申请日:2024-03-26

公开(公告)日:2024-06-11

公开(公告)号:CN118172540A

主分类号:G06V10/25

分类号:G06V10/25;G06V10/82;G06V10/44;G06V10/80;G06V10/26;G06N3/0455;G06N3/0464;G06N3/08;G06V10/764

优先权:

专利状态码:在审-公开

法律状态:2024.06.11#公开

摘要:本发明公开了一种基于金字塔型视觉Transformer的伪装目标检测方法和系统,属于计算机视觉技术领域。本发明用于对图像中与环境具有相似的视觉特征的伪装物体进行定位和像素级分割。输入的图像通过基于金字塔型视觉Transformer的编码器,得到用于伪装目标检测任务的图像特征。解码器由基于二维多头自注意力的分割推理模块和基于一维多头自注意力的边缘推理模块构成,将图像特征进一步解析为分割掩码,作为模型的输出结果。本发明能够准确的对具有纹理欺骗性、边缘模糊性的伪装目标进行分割,有效解决了常规目标分割方法对于复杂环境中难以识别的伪装目标分割不准确的问题。

主权项:1.一种基于金字塔型视觉Transformer的伪装目标检测方法,其特征在于,包括以下步骤:1利用包含伪装物体的图像及其像素级掩码标签训练伪装目标检测模型,所述的像素级掩码标签包括边缘标签和分割标签;所述的伪装目标检测模型由编码器和解码器组成,编码器的层数和解码器的层数一一对应,所述编码器采用金字塔型视觉Transformer在多个层级上按照从顶层到底层的顺序依次提取分辨率由高到低的图像特征并进行通道数统一,生成多层编码特征;所述解码器在多个层级上按照从底层到顶层的顺序逐层解码,输出各层边缘预测掩码和分割预测掩码,根据边缘预测掩码、分割预测掩码、边缘标签和分割标签训练所述的伪装目标检测模型;所述解码器的每一层包括基于一维多头自注意力的边缘推理模块、基于二维多头自注意力的分割推理模块,所述的边缘推理模块以各层编码特征和基于各层编码特征生成的粗略掩码为输入,并引入分割标签,生成边缘推理特征;所述的分割推理模块以各层边缘推理特征和基于各层边缘推理特征生成的前景掩码为输入,生成分割推理特征,并根据各层分割推理特征生成各层边缘预测掩码和分割预测掩码;除解码器底层外的其余层分割推理模块中,将前一层解码生成的分割推理特征与当前层的边缘推理特征融合,作为更新后的当前层边缘推理特征,并基于更新后的当前层边缘推理特征计算分割推理特征;2将待处理的包含伪装物体的图像作为训练后的伪装目标检测模型的输入,在解码器底层,跳过分割推理模块,直接将底层编码特征作为边缘推理特征;在解码器的除底层外的其余层的边缘推理模块中,将前一层的分割预测掩码作为伪标签代替分割标签;将顶层解码器生成的分割预测掩码作为伪装目标检测模型的最终输出;3利用目标检测模型最终输出的分割预测掩码从包含伪装物体的图像中分割出目标图像,实现伪装目标检测任务。

全文数据:

权利要求:

百度查询: 浙江大学 一种基于金字塔型视觉Transformer的伪装目标检测方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。