恭喜南京大学王利民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京大学申请的专利一种基于自适应解码器的目标检测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114612716B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210227694.7,技术领域涉及:G06V10/764;该发明授权一种基于自适应解码器的目标检测方法及装置是由王利民;高子腾;刘春旭;武港山设计研发完成,并于2022-03-08向国家知识产权局提交的专利申请。
本一种基于自适应解码器的目标检测方法及装置在说明书摘要公布了:一种基于自适应解码器的目标检测方法及装置,构建一个目标检测模型AdaMixer,包括网络配置阶段、训练阶段以及测试阶段,配合骨干网络得到的不同大小的特征图组合成3D特征空间,在其中进行高效的特征采样,并通过自适应地配合查询量的空间信息和位置信息完成对采样特征的增强,实现目标检测任务。本发明通过对不同图片查询量的自适应模块,有效利用查询量中的信息,避免了冗余网络结构,节省了计算量,使网络快速稳定收敛。引入了3D特征空间的采样,对位置信息和语义信息进行高效的编码,能更好地配合自适应模块,灵活、高效、快速、准确地完成目标检测任务。
本发明授权一种基于自适应解码器的目标检测方法及装置在权利要求书中公布了:1.一种基于自适应解码器的目标检测方法,其特征是构建一个目标检测模型AdaMixer,根据3D采样特征空间对图片的多尺度特征进行采样,并基于查询机制通过编码器和解码器自适应地根据查询的空间位置信息和语义内容信息进行采样点位置和特征解码的调节,再配合FFN完成对查询的增强,实现查询位置的检测,所述目标检测网络的实现包括生成3D特征阶段、网络配置阶段、训练阶段以及测试阶段: 1生成3D特征阶段:使用骨干网络对训练样例图像进行特征提取,对于每个输入图像,基于骨干网络不同阶段输出的不同长宽、不同通道数的特征图,得到一个3D特征空间,用于在其中完成后续的采样处理; 2网络配置阶段,基于初始查询配置和解码器,建立目标检测模型AdaMixer,包括以下配置: 2.1初始查询配置:为输入特征图初始化编码生成N个初始查询量,查询量中包括初始语义向量q0,以及对应查询采样点的初始位置向量x,y,z,r,x,y,z是采样点在3D特征空间中的坐标,r是特征图的高宽比的以2为底的对数,初始语义向量q0从标准正态分布N0,1中随机采样得到,初始位置向量x,y,z,r设置为能够覆盖整张特征图; 2.2解码器:解码器的输入是2.1中编码生成的查询量,输出是经过解码器优化之后的相同格式的查询量,解码器中包含以下模块,用于自适应地利用查询中语义信息和位置信息: 2.2.1多头自注意力模块:将N个查询量输入一个多头自注意力模块,使用正弦形式的位置信息附加到语义向量上,并将交集前景比IoF作为一个偏置加入注意力的权重,经过该多头自注意力模块得到一个增强后的语义向量输出q; 2.2.23D采样模块:使用2.2.1中得到的q,经过一个线性层的变换之后,利用q的语义信息得到Pin个采样点位移集合,结合查询量中对应的位置向量四元组,得到Pin个3D特征空间采样点坐标P,根据采样点坐标P先在x,y的特征空间中做两点插值,得到一个不考虑z轴权重的特征矩阵,然后再在z轴上做高斯权重插值,进而得到完整的采样后的特征矩阵X; 2.2.3自适应混合模块:对特征矩阵X进行自适应地解码,分两步对采样后的特征矩阵X进行自适应混合,分别为自适应语义通道混合以及自适应空间信息混合,在自适应语义通道混合中,使用基于q的动态权重矩阵在特征通道上对特征矩阵X进行通道语义增强;在自适应空间信息混合中,使用基于q的动态权重矩阵在空间信息上对特征矩阵X进行空间信息增强;最终得到信息增强后的特征矩阵X’; 2.2.4FFN模块:对于2.2.3中输出的更新后的特征矩阵X’,结合其位置向量,对整体的查询中的语义向量和位置向量进行更新,即对2.2.3得到特征矩阵X’展平,经过一组FFN,将其通道数转换到q的相同通道数,得到更新后的查询中的语义向量q′;根据更新后的语义向量q′,再经过一组FFN,得到一组更新后的查询中的位置向量x′,y′,z′,r′; 2.3得到最终的查询语义向量q′以及位置向量x′,y′,z′,r′后,将q′送入一个FFN分类网络中得到分类结果,将x′,y′,z′,r′翻译成包围框的坐标得到包围框的结果; 3训练阶段:对配置的网络模型采用训练数据进行训练,使用focalloss,L1loss和GIoUloss组合作为损失函数,使用AdamW优化器,通过反向传播算法来更新网络参数,不断重复步骤1和步骤2,直至达到迭代次数; 4训练阶段:将待测试数据的图片特征输入到训练完成的AdaMixer模型中,根据2.3中的方式,得到最终的目标分类结果以及目标包围框位置,验证所训练AdaMixer模型的效果,达到所需目标检测效果的AdaMixer模型作为最终所得目标检测模型,用于目标检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。