买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于对抗神经网络的跨域行人重识别方法_南京信息工程大学_202011464169.4 

申请/专利权人:南京信息工程大学

申请日:2020-12-14

公开(公告)日:2024-04-26

公开(公告)号:CN112488035B

主分类号:G06V40/10

分类号:G06V40/10;G06V10/774;G06V10/764;G06V10/82;G06N3/045;G06N3/0475;G06N3/084;G06N3/094;G06N3/088

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2021.03.30#实质审查的生效;2021.03.12#公开

摘要:本发明涉及一种基于对抗神经网络的跨域行人重识别方法。涉及循环一致性对抗网络、DCGAN、ResNet50和行人重识别等领域;具体包括以下步骤:1、构建行人重识别分类器;2、目标数据集映射到带标签数据集;3、DCGAN优化映射网络;4、优化算法。本发明使得行人重识别技术能在更加真实的场景上得以应用,充分利用没有标签的数据集,缩小了目标真实数据集与原带标签数据集上样本的特征差距,能使召回率更加准确和有效。

主权项:1.一种基于对抗神经网络的跨域行人重识别方法,其特征在于,具体步骤包括如下:步骤1.1、构建行人重识别分类器:在带标签的行人数据集上预训练一个行人分类器;其中,所述构建行人重识别分类器的具体方法如下:设带标签的训练集共有N张训练样本,分为T个不同的身份,每个训练样本均包括一个身份标签,则损失函数L的定义为: 式中,表示输入样本In属于类Tn的可能性,L表示分类器损失,N表示待分类样本数,n表示待分类样本,yj表示j所属类别,j表示待分类样本;步骤1.2、将目标数据集样本映射到原数据集上:将不带标签的目标数据集映射到带标签的原数据集上,缩小两个数据集间样本差距;利用域映射模型将目标数据集样本映射到原数据集上,具体是指在样本映射模型中,将目标数据中的样本一一映射到原数据集中;其中所述的样本映射模型包含两个生成器完成映射任务,即:G:IS→IT和H:IT→IS,其中,IS表示带有标签的原数据集,IT表示无标签的目标数据集;另外,所述的域映射模型还具有两个判别器,即DS和DT,其中,DS是用来判断输入样本是来自于原数据集,亦或是由HIT生成;同理,DT是用来判断输入样本是来自于目标数据集,亦或是由GIs生成;所述的判别器和生成器的损失函数来自循环一致性对抗损失,采用最小二乘损失来优化每一对生成器和判别器;对于生成器H:IT→IS来说,其损失函数定义为: 最小化上述损失函数的目的是为了将目标数据集中的样本映射到原数据集中,其中,x=1,2;并让判别器DS认为这个输入样本是来自于真实的原数据集中,而不是由生成器H:IT→IS生成的;同理,对于判别器DS的损失函数定义为: 对于这里的判别器DS来讲,其任务是来判断输入样本是来自于原数据集,还是由HIT生成的,可看出,LH和是一对对抗损失,同时给生成器G:IS→IT定义为: 为判别器DT的损失函数,其定义为: 为了避免样本转换之间出现大的差异,引入了循环一致性损失,其定义为: 在优化阶段,采取了随机梯度下降的方法来优化两对生成器与判别器;将上述的损失函数相结合并赋予了一些权重,最终得到的对与生成器需要优化的损失函数为:Lgen=LG+LF+λLcycle;式中,λ控制了循环一致性损失影响整个损失函数的程度;将所有判别器的损失函数融合在一起,其式如下: 在每一次的迭代过程中会使用Lgen,采用随机梯度下降的反向传播方法更新G和H的参数;使用同样的方法对Ldis梯度下降,更新DT和DS的参数;步骤1.3、利用DCGAN优化映射模型:对得到的映射模型进行优化;利用DCGAN优化映射模型的具体操作方法如下为:对于得到的两个生成器,G和H;分别是可以从不带标签的域映射到带标签域上的生成器和可以从不带标签的域映射到不带标签域上的生成器;当两个数据集之前的分布存在差距时,则两个生成器的映射往产生模糊;不能将在有标签的原数据集上训练得到的分类器拟合到由生成器H得到的HIT上;所述的模型中所使用的DCGAN的生成器的输入不是来自于噪声分布,而是由H构成,损失函数就是步骤1.2中的全体损失函数,所述的判别器则是利用来自原数据集上的样本和由生成的从目标数据集映射到原数据集上的样本作为输入;其中,判别器设置4层卷积层;为了防止梯度消失与梯度爆炸,每层卷积之间加入了局部归一层;除全连接层使用sigmoid激活函数以外,其余的激活函数统一使用LeakyRelu;设置标签值yi,预测值为则经过激活函数输出为设样本总数为N,得到的损失函数表达式为: 其中,对抗学习的博弈性就体现在标识符i的取值上;对于判别器,当i=1时,表示输入为真实数据,对应标签yi=1为真,触发针对判别器的训练;当i=2时,表示输入为生成图像,对应yi=0为假,触发判别器与生成器的联动;对于生成器,i=3表示输入为生成图像,对应yi=1为真,触发针对生成器的训练;步骤1.4、相关算法优化:引入正则化,使模型具备较好泛化能力,避免过拟合;所述相关算法优化的具体操作方法如下:引入正则化概念,其中,L2正则可分别表达为: 正则项之前α是一个系数,θi表示成每层权重的倒数,表示对于学习到过高权重的层,需降低其更新程度;相反,对于层中学习到过低的权重的结点反而要提高其更新程度,从而达到层中所有权值平摊任务的目的;在生成器的损失函数构建中,在损失函数后又加上L2正则化式子,如下式所示, 其中,α设为0.0001;在之后的网络训练过程中,采用学习率衰减策略以加快训练速度;学习率衰减策略可表示为下式;每当训练一定次数,学习率将会减少;其中decayrate为初始系数,epochi表示第i次训练,α0是初始学习率;如下式所述:

全文数据:

权利要求:

百度查询: 南京信息工程大学 一种基于对抗神经网络的跨域行人重识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。