【发明授权】基于文本辅助特征对齐模型的受损行人图像再识别方法及装置_中山大学_202210242707.8

导航：龙图腾网> 最新专利技术> 基于文本辅助特征对齐模型的受损行人图像再识别方法及装置_中山大学_202210242707.8

申请/专利权人：中山大学

申请日：2022-03-11

公开（公告）日：2024-05-31

公开（公告）号：CN114596588B

主分类号：G06V40/10

分类号：G06V40/10;G06F16/583;G06V10/74;G06V10/764;G06V10/82;G06N3/0464;G06N3/047;G06N3/0455;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.05.31#授权;2022.06.24#实质审查的生效;2022.06.07#公开

摘要：本发明公开了基于文本辅助特征对齐模型的受损行人图像再识别方法及装置，包括：构建文本辅助特征对齐模型，对文本辅助特征对齐模型进行训练，训练过程分为两个阶段，第一阶段为语句层面特征提取，第二阶段为名词短语层面特征对齐；将测试集中的受损图像输入到深度卷积神经网络‑Corrupted以及全局平均池化层中提取得到受损图像特征向量；将参考集中的正常图像输入到深度卷积神经网络‑Normal以及全局平均池化层中提取得到未受损图像特征向量；使用测试集提取得到的受损特征向量与参考集提取得到的未受损特征向量进行相似度计算。本发明能高效地检索出受损的行人图像在正常行人数据库中相同身份的正常图像，提高行人再识别方法在实际应用场景中的鲁棒性。

主权项：1.基于文本辅助特征对齐模型的受损行人图像再识别方法，其特征在于，包括下述步骤：构建文本辅助特征对齐模型，所述文本辅助特征对齐模型包括深度卷积神经网络-Normal、深度卷积神经网络-Corrupted、全局平均池化层、双向门控循环单元和损失函数层，所述深度卷积神经网络-Normal和深度卷积神经网络-Corrupted的网络结构相同，由多个不同大小的卷积层模块组成，所述全局平均池化层对输入到特征图的每一个通道进行均值化处理，将高维的特征图展平成一维的特征向量，所述双向门控循环单元由两个结构相同的门控循环单元组成，通过可以学习的重置门和更新门来控制信息流动，改变隐藏状态，损失函数层由多个损失函数组成，包括有分类损失函数、跨模态相似度误差函数和特征对齐损失函数；对文本辅助特征对齐模型进行训练，训练过程分为两个阶段，第一阶段为语句层面特征提取，第二阶段为名词短语层面特征对齐；将测试集中的受损图像输入到深度卷积神经网络-Corrupted以及全局平均池化层中提取得到受损图像特征向量；将参考集中的正常图像输入到深度卷积神经网络-Normal以及全局平均池化层中提取得到未受损图像特征向量；使用测试集提取得到的受损特征向量与参考集提取得到的未受损特征向量进行相似度计算，首先计算测试集受损特征向量与参考集所有未受损特征向量之间的欧式距离，找到欧式距离最小的参考集特征向量，将该参考集特征向量的身份标签标注在测试集受损特征的输入受损行人图像上；所述语句层面特征提取具体为：语句层面文本特征提取，将行人文本描述t映射成词向量，将词向量输入到双向门控循环单元Bi-GRU中提取文本特征；将正常图像xN输入到深度卷积神经网络-Normal中，再经过全局平均池化层处理，得到512维的正常视觉特征向量fiN；将受损图像xC输入到深度卷积神经网络-Corrupted中，再经过全局平均池化层处理，得到512维的受损视觉特征向量fiC；为了能让卷积神经网络和双向门控循环单元生成具有可鉴别性的特征向量，利用数据的身份标签计算这三种特征向量的分类损失Lid；为了能让正常视觉特征向量fiN和受损视觉特征向量fiC在特征空间中与文本特征fiT有相似的关联性，提供一个跨模态相似度误差函数来对其进行约束，正常视觉特征向量fiN，受损视觉特征向量fiC和语句层面的文本特征fiT经过正则化处理后，分别计算视觉特征和文本特征之间的均方误差；其中MSE·，·为均方误差计算，||·||为2-范数计算；语句层面文本特征提取具体为：其中，wt为第t个词向量，ht-1为处理完第t-1个词向量的Bi-GRU的隐藏层参数，右箭头表示正向序列，左箭头表示反向序列；将正向与反向的最终输出级联到一起，再经过一个全连接层的处理，得到语句层面的文本特征fiT，是表示正向输出，表示反向输出，Concat·，·为级联操作，FC·为全连接层；所述名词短语层面特征对齐具体为：利用第一阶段预训练好的深度卷积神经网络进行微调训练，提取特征向量，将正常图像xN输入到深度卷积神经网络-Normal中，再经过全局平均池化层处理，得到正常视觉特征向量fiN，将受损图像xC输入到深度卷积神经网络-Corrupted中，再经过全局平均池化层处理，得到受损视觉特征向量fiC；分别计算正常视觉特征向量fiN和受损视觉特征向量fiC的分类损失Lid；为了进一步对齐正常视觉特征向量fiN和受损视觉特征向量fiC的数据分布，减小两种特征向量之间的差异，采用特征对齐损失对其进行约束，从特征层面和标签预测层面分别进行对齐；根据词语的词性，对行人文字描述语句进行划分，滤除多余的单词获得所有名词短语{n1，n2，…，nM}，利用第一阶段预训练好的双向门控循环单元进行微调训练，提取各个名词短语的特征向量将名词短语的特征向量正常视觉特征向量fiN和受损视觉特征向量fiC输入到模态间关联性模块中加强不同模态间特征向量的关联程度；所述加强不同模态间特征向量的关联程度，具体为：首先计算正常视觉特征向量fiN与各个名词短语特征向量的关联因子：根据关联因子对名词短语特征向量进行加权融合处理，得到正常图像关联名词短语特征向量同理，可获得受损图像关联名词短语特征向量利用特征对齐损失Lalign加强与的相似性，保证正常视觉特征向量与受损视觉特征向量拥有相似的与名词短语特征向量的关联度，使得它们与每个名词短语的激活程度相似。

全文数据：

权利要求：

百度查询：中山大学基于文本辅助特征对齐模型的受损行人图像再识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：模型轻量化方法、装置、计算机设备、存储介质及程序产品_苏州元脑智能科技有限公司_202410372700.7

下一篇：一种用于化纤在线取丝饼自动暂存的中转机器人_安歌科技(集团)股份有限公司_202210543752.7

相关技术

模型轻量化方法、装置、计算机设备、存储介质及程序产品_苏州元脑智能科技有限公司_202410372700.7

一种用于化纤在线取丝饼自动暂存的中转机器人_安歌科技(集团)股份有限公司_202210543752.7

用于铝基复合材料焊接的超声波预热激光焊接设备_恒超源洗净科技(深圳)有限公司_202410448442.6

温度控制方法、装置、设备以及存储介质_深圳市汇川技术股份有限公司_202211206401.3

一种固态电解质包覆的钴酸锂正极材料及其制备方法_英德市科恒新能源科技有限公司_202410408908.X

利拉鲁肽的合成_拜康有限公司_201780086325.8

一种车钩安装座高效焊接装置_南京海高德新技术有限公司_202311587530.6

一种4-环己基-3-(三氟甲基)苯甲醇的制备方法_浙江工业大学_202211411775.9

一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

一种馍片生产的输送带自清洁装置_晋城市丰昇源面业股份有限公司_202410231905.3

一种汽车风窗玻璃试验中AB区的投射设备_中汽研汽车检验中心(武汉)有限公司_202410456408.3

模型相关技术

一种规划模型_新疆创青晨环保科技有限公司_202322707294.9

模型更新方法、模型更新装置以及计算机存储介质_浙江大华技术股份有限公司_202410316236.X

模型预训练方法、模型训练方法、对象处理方法及装置_北京百度网讯科技有限公司_202310701200.9

模型增量训练方法、系统以及应用于日志异常检测的模型_深圳市溪数科技有限公司_202410119055.8

模型生成装置、模型生成方法及数据估计装置_株式会社力森诺科_202280075750.8

一种倾斜摄影模型与BIM模型比对分析的方法_中铁市政环境建设有限公司_202410432814.6

插拔式中间接头缺陷模型及模型的制作方法_青岛华电高压电气有限公司_201810541343.7

基于大模型技术的模型服务提供方法、平台及电子设备_北京百度网讯科技有限公司_202410324021.2

一种陶瓷房屋模型_福建省德化县杰宝陶瓷有限公司_202322594456.2

智慧机房模型管理系统及方法_浪潮通信信息系统有限公司_202410347572.0

图像相关技术

图像处理方法及图像处理设备_东软医疗系统股份有限公司_202410410737.4

图像处理装置和图像处理方法_爱思开海力士有限公司_202311055069.X

图像处理装置和图像处理方法_爱思开海力士有限公司_202310957003.3

图像处理装置、图像处理方法及图像处理系统_爱思开海力士有限公司_202311159508.1

图像转换装置及包含图像转换装置的图像系统_英特尔公司_202322563332.8

图像处理设备、图像处理方法和存储介质_佳能株式会社_202311751946.7

图像处理装置、摄像装置和图像处理方法_日本株式会社皆爱公司_202280075041.X

图像形成装置及图像形成装置的控制方法_东芝泰格有限公司_201910989416.3

图像处理装置、图像处理方法和存储介质_佳能株式会社_202210683616.8

显影装置、图像形成单元以及图像形成装置_东芝泰格有限公司_202010093524.5

受损相关技术

一种修复受损头发组合物及其制备方法_广州天玺生物科技有限公司_202410412220.9

一种光伏支架的受损自检机构_扬州市金阳光铸造有限公司_202410303696.9

一种可快速更换受损钻头的旋挖钻机_江西隆通建设工程有限公司_202410467598.9

一种面向通讯受损场景的无人机分布式协同预测控制方法_浙江工业大学_202410139815.1

一种智能吹风机、防受损控制系统及控制方法_广州鹰堡美发用品厂有限公司_202410293250.2

一种有利于重构头发受损二硫键的发膜_广州科堡化妆品有限公司_202410268210.2

一种水下桥墩受损的加固结构_江西省路桥工程集团有限公司_202322871038.3

一种用于修复受损鼻腔粘膜的组合物及其制备方法和应用_湖南天根乐微君科技有限公司_202410180265.8

一种基于BP神经网络的车辆撞击桥梁受损评估方法和系统_陕西交控通宇交通研究有限公司_202410242175.7

基于文本辅助特征对齐模型的受损行人图像再识别方法及装置_中山大学_202210242707.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】基于文本辅助特征对齐模型的受损行人图像再识别方法及装置_中山大学_202210242707.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务