一种基于稀疏检测的端到端的行人搜索方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京大学

摘要：本发明公布了一种基于稀疏预测的端到端的行人搜索方法，构建行人搜索模型，基于目标检测模型设计行人重识别分支，使用行人边界框在特征金字塔网络中进行感兴趣区对齐操作，得到对应行人的固定大小的特征图，再采用线性层从特征图中抽取出用于行人重识别的特征；且在目标检测中使用特征金字塔网络的所有输出特征，而在行人重识别中则只使用特征金字塔网络中分辨率最高的最底层的输出特征，使得行人搜索效果达到最优；利用训练图像数据集训练行人搜索模型；使用训练好的行人搜索模型对待搜索的图像进行行人搜索。本发明方法流程简单、方法高效，且行人搜索实时性良好。

主权项：1.一种基于稀疏预测的端到端的行人搜索方法，构建行人搜索模型，基于目标检测模型设计行人重识别分支，使用行人边界框在特征金字塔网络中进行感兴趣区对齐操作，得到对应行人的固定大小的特征图，再采用线性层从特征图中抽取出用于行人重识别的特征；且在目标检测中使用特征金字塔网络的所有输出特征，而在行人重识别中则只使用特征金字塔网络中分辨率最高的最底层的输出特征，使得行人搜索效果达到最优；利用训练图像数据集训练行人搜索模型；使用训练好的行人搜索模型对待搜索的图像进行行人搜索；包括如下步骤：1）构建行人搜索模型；行人搜索模型的输入为图像，模型输出为图像中每个行人的边界框和重识别特征；构建模型结构包括：骨干网络、特征金字塔网络、检测分支和重识别分支；重识别分支包含感兴趣区对齐和线性层结构；使用SwinTransformer作为骨干网络，从输入的图像中抽取多层次的特征图，得到的特征图，记为{F1,F2,F3,F4}；将特征图{F1,F2,F3,F4}在特征金字塔网络中进行融合，得到与{F1,F2,F3,F4}尺寸相同的新的特征图，记作{P1,P2,P3,P4}；使用SparseR-CNN作为检测分支，对特征图{P1,P2,P3,P4}进行回归预测，得出图像中的行人的边界框；SparseR-CNN检测分支中每个查询向量和每个查询框一一对应；查询向量和查询框内的图像特征通过SparseR-CNN中的动态卷积进行交互，即使用查询框对应的图像特征动态地生成卷积核，再对每个查询向量进行加权；11）骨干网络用于从输入的图像中抽取得到多层次的特征图；12特征金字塔网络用于将特征图进行进一步的融合，得到新的特征图：13）检测分支使用一组查询向量和查询框对特征图进行行人检测，输出图像中每个行人的边界框；14）重识别分支根据行人边界框从特征金字塔网络的输出特征中提取和输出用于重识别的行人特征；包括如下过程：141）首先，对于特征金字塔网络输出的特征图的某层中的行人边界框进行感兴趣区对齐操作，得到对应于每个行人的固定尺寸的二维特征；然后将二维特征拉平，变成一维特征；再使用线性层压缩维度，得到每个行人在该层的重识别特征；142）扩展到多层特征图：在两层特征图上分别采用步骤141）的方法，抽取出两层特征图相应的两个重识别特征，再将两个重识别特征求和、归一化，作为输出的重识别特征；2）利用训练图像数据集训练步骤1）构建的行人搜索模型，采用在线实例匹配OIM作为模型训练的损失函数；训练行人搜索模型中的重识别分支时，包括：在模型训练的前半周期，同时使用输入图像中真实标注的行人边界框和经模型检测分支输出的行人边界框训练重识别分支；在模型训练的后半周期，只使用检测分支输出的行人边界框作为重识别分支的输入，来训练重识别分支；3）使用训练好的行人搜索模型对待测搜索的图像进行行人搜索，包括：31）通过行人搜索模型中的检测分支进行行人检测：32）使用行人搜索模型中的独立的重识别分支进行行人重识别特征的抽取；4）使用模型输出的行人边界框和行人重识别特征，通过计算行人重识别特征之间的余弦相似度，判定相应的行人边界框内是否为同一个行人，从而实现行人搜索。

全文数据：

权利要求：

百度查询：北京大学一种基于稀疏检测的端到端的行人搜索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种消化内科催吐装置

下一篇：一种基于可逆热致变色微胶囊的复合绝缘材料及其制备方法

相关技术

一种消化内科催吐装置

一种基于可逆热致变色微胶囊的复合绝缘材料及其制备方法

机载光电设备反射镜均热化控温装置

一种鱼类产卵行为与生态水文指标响应关系量化方法

一种注册终端设备的方法及装置

图像检测方法、装置、设备、存储介质及程序产品

一种新型鹅星状病毒疫苗及其制备方法与应用

一种道路靶向安全警示系统、其使用方法及多个系统之间建立私有局域网的使用方法

一种有效微生物群活性菌剂及其应用方法

一种用于光伏板边框的铝合金型材

一种导热系数低的复合墙体保温砌块及其制备方法

挖掘装置极限工况的结构优化方法、装置、设备及介质

行人相关技术

一种新型的多模态融合的行人重识别方法_郑州大学_202210190938.9

基于卷积神经网络的行人流密度与流量预测系统及方法_中南民族大学_202410810113.1

一种利于行人头部保护的发盖及汽车_奇瑞汽车股份有限公司_202410908312.6

基于飞参数据的飞行人员能力分析的方法_上海久航电子有限公司_202410730144.6

一种基于通道注意力的行人再识别对抗攻击方法_南通大学_202211353732.X

一种低速场景下的行人微碰撞识别方法及系统_重庆长安汽车股份有限公司_202210771279.8

一种兼顾精度和轻量化的行人车辆检测方法_东北电力大学_202410820116.3

一种基于行人运动特征优化的视觉惯性定位方法_中国科学院空天信息创新研究院_202410140900.X

一种基于掩码自监督遮挡像素重建的遮挡行人重识别方法_哈尔滨理工大学_202410016648.1

一种基于毫米波雷达与单目相机融合的行人检测方法_济南大学_202410883599.1

端相关技术

压铸端板整形装置_润星泰(常州)技术有限公司_202420274419.5

一种基于端到端神经网络的单幅图像去雨方法_南通大学_202210156295.6

端到端自动驾驶系统中的内容生成方法、设备及车辆_阿波罗智能技术(北京)有限公司_202410685130.7

支持数据重复的方法、发射端设备和接收端设备_OPPO广东移动通信有限公司_201880037596.9

远程调试信息获得方法、装置、服务端、客户端及介质_杭州海康威视数字技术股份有限公司_202411162334.9

一种XR立体互动直播构建方法、主播端及观众端_深圳职业技术大学_202410597901.7

一种用于水泵进水端或出水端带检修密封副的球阀_远大阀门集团有限公司_202411173746.2

用于车端的长连接方法_同程网络科技股份有限公司_202410811723.3

山药去两端装置_滨州学院_201911182786.2

一种添加地址信息的方法和系统、客户端及服务端_北京沃东天骏信息技术有限公司_202010478785.9

检测相关技术

检测系统和检测方法_苏州长光华芯光电技术股份有限公司_202411154623.4

移动方向的检测电路、检测装置以及检测系统_清华大学_202410726430.5

天车轨道变形检测装置、检测系统及检测方法_北京爱地地质工程技术有限公司_202210846472.3

内存检测方法及其检测系统_芯梦达半导体科技(济南)有限公司_202410704700.2

检测判定机和检测判定方法_电化株式会社_201980063933.6

检测系统_清华大学_202323608247.5

检测设备_珠海科创储能科技有限公司_202323641434.3

检测机构_精塑汽配科技(惠州)有限公司_202323583476.6

一种检测机器人的桥梁检测装置及其检测方法_于华杰_202410711531.5

一种检测装置及检测方法_深圳中科飞测科技股份有限公司_201910457362.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于稀疏检测的端到端的行人搜索方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务