首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于掩码先验和分层聚合Transformer的遮挡行人重识别方法 

申请/专利权人:南京信息工程大学

申请日:2024-04-07

公开(公告)日:2024-06-25

公开(公告)号:CN117994823B

主分类号:G06V40/10

分类号:G06V40/10;G06V10/764;G06V10/80;G06V10/82;G06V10/40;G06N3/0455;G06N3/0464;G06V10/74

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.05.24#实质审查的生效;2024.05.07#公开

摘要:本发明公开了一种基于掩码先验和分层聚合Transformer的遮挡行人重识别方法,包括以下步骤:(1)获取多种数据集(2)构建掩码语义信息提取器;(3)构建用于处理图片信息,进行提取特征的Transformer骨干网络;(4)构建用于提取细粒度部分特征的分层特征聚合模块;(5)构建用于提取判别性全局特征的多特征补偿模块;(6)合并步骤(2)‑(5),构建基于掩码先验以及分层聚合Transformer的遮挡行人重识别框架;(7)构建用于遮挡行人重识别模型的损失函数;(8)加载由IMAGENET训练的预训练权重,利用Occluded‑Duke数据集的训练集对模型进行训练,测试集对得到的模型进行测试,寻找最优模型;本发明引导模型关注非遮挡身体部位以及提取判别性信息用于行人匹配。

主权项:1.一种基于掩码先验和分层聚合Transformer的遮挡行人重识别方法,其特征在于引导模型关注非遮挡身体部位以及提取判别性信息用于行人匹配,包括以下步骤:(1)获取多种数据集包括:用于掩码提取器预训练的COCO数据集和Transformer骨干网络预训练的IMAGENET数据集,以及用于行人重识别的完整数据集:Market-1501、MSMT17,遮挡数据集:Occluded-Duke和Occluded-REID;(2)构建掩码语义信息提取器,包含语义信息处理模块;在语义信息处理模块中包含将图像分割成块的PatchEmbedding操作以及全连接层线性映射函数的实现;(3)构建用于处理图片信息,进行提取特征的Transformer骨干网络;(4)构建用于提取细粒度部分特征的分层特征聚合模块;包括以下步骤:(41)输出transformer中12层编码器结构第2,4,10,12层后的图片块特征表示;(42)将输出的第2,4,10,12层图片块特征表示分别进行形状调整并连接到一起,输入到卷积层网络并进行全局最大池化操作来提取细粒度部分特征,卷积层网络由连续的三个3*3卷积以及BatchNorm和ReLU激活函数组成;(5)构建用于提取判别性全局特征的多特征补偿模块;(6)合并步骤(2)-(5),构建基于掩码先验以及分层聚合Transformer的遮挡行人重识别框架;(7)构建用于遮挡行人重识别模型的损失函数,包含用于全局特征的损失函数以及用于部分特征的损失函数;(8)加载由IMAGENET训练的预训练权重,利用Occluded-Duke数据集的训练集对模型进行训练,测试集对得到的模型进行测试,寻找最优模型。

全文数据:

权利要求:

百度查询: 南京信息工程大学 一种基于掩码先验和分层聚合Transformer的遮挡行人重识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。