首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种改进的核相关滤波跟踪算法_北京工业大学_202210595354.X 

申请/专利权人:北京工业大学

申请日:2022-05-29

公开(公告)日:2024-06-11

公开(公告)号:CN115019249B

主分类号:G06V20/52

分类号:G06V20/52;G06N3/0464;G06N3/08;G06V10/44;G06V10/80;G06V10/82

优先权:

专利状态码:有效-授权

法律状态:2024.06.11#授权;2022.09.23#实质审查的生效;2022.09.06#公开

摘要:一种改进的核相关滤波跟踪算法涉及图像跟踪领域。本发明引入CN颜色特征并进行特征融合,增强目标的特征表达能力;其次引入尺度池并进行划分,设计了新的尺度搜索策略;通过平均峰值相关能量作为跟踪置信度指标区分目标是否处于异常状态,判断模型是否更新,再使用旁瓣检测对状态细分,判断是否启用重检测步骤。本发明对核相关滤波跟踪算法进行全方面的改进,使用C++算法编写,建立了基于视觉的改进核相关滤波跟踪算法,以解决旧算法目标尺度固定与易产生模型漂移的问题。

主权项:1.一种改进的核相关滤波跟踪算法,其特征在于:1CN特征融合;核相关滤波跟踪算法使用单目摄像头采取彩色图像,通过选定任意目标进行FHOG特征提取;FHOG在划分区间时,分别进行了无符号划分与有符号划分,FHOG特征划定每个细胞元为4×4像素,每个细胞元能分别生成一个9维的无符号特征与18维的有符号特征;FOHG特征再将9维无符号特征来与其周围8个细胞元进行归一化与截断,归一化与截断为一个过程,即当前细胞元分别与其左上、右上、右下、左下包含当前细胞元的四个细胞元的特征进行叠加,形成一个4×9的特征矩阵;后将4×9的特征矩阵每行每列分别相加,得到4+9=13维特征向量,最后形成13+18=31维特征向量;通过将CN特征与FHOG特征进行特征向量的拼接,以求取更明显的目标特征表达;在此过程中,对FHOG特征进行进一步改进,即不再使用9维的无符号特征向量,而仅使用18维的有符号特征向量,将18维有符号特征来进行归一化与截断,形成一个4×18的特征矩阵,后将4×18的特征矩阵每行每列分别相加,得到4+18=22维特征向量最后再将其与11维的CN特征向量进行拼接,最终形成4+18+11=33维的特征向量;拼接的方式为11维的CN特征向量直接连接在22维的FHOG特征向量尾部形成一个特征向量;2尺度自适应;目标尺度大部分落在[0.9,1、1,1.1]两个区间,超出[0.9,1.1]区间的尺度绝大部分不超过原尺度的1.25倍,最小尺度则不低于原尺度的0.75倍;提供了四个尺度区间,分别为[0.75,0.9、[0.9,1、1,1.1]、1.1,1.25],并对这四个区间进行了划分;尺度落在[0.9,1、1,1.1]这两个区间的概率最大,给每个区间划分为4个尺度;尺度落在另外两区间的概率较小,给每个区间划分了3个尺度;最终形成3+4+1+3+4=15维的尺度池S={0.75,0.8,0.85,0.9,0.925,0.95,0.975,1,1.025,1.05,1.075,1.1,1.15,1.2,1.25}尺度池由公式表示,式中m=7,n=4,-m=-7,-n=-4;S={t-m,…,t-n-1,t-n,…,t-1,t,t1…,tn,tn+1,…,tm}目标在视频序列中尺度的变化具有短时一致性,即在一定的帧数内目标尺度会向同一个方向变化,记录此信息起到辅助选取尺度的作用;具体的方法为:选取10帧为一个周期,分别记录10帧内每帧目标尺度的变化情况;为每一帧定义一个变量myScale,为myScale定义不同的数值来表示尺度的变化情况:myScale=2:尺度变大,0:尺度不变,-2:尺度变小;同时维护一个变量mySum用来统计每10帧myScale的和;式中i代表当前帧数,N代表视频总帧数;mySum的值需在尺度开始搜索之前计算出来; mySum的值代表不同的含义,其和大于0代表近10帧中出现目标尺度变大的情况多,当前帧目标尺度变大的概率越大,优先搜索;若mySum小于0,代表当前帧目标尺度变小的概率较大;当mySum等于0时,目标的尺度可能一直未发生变化,也可能表示在近10帧中出现尺度变大与变小的帧数相等;结合当前帧尺度变化的概率,实现尺度的预测,降低计算量;先确定尺寸变化方向,再验证尺寸是否突变,最后确定最佳尺寸;具体表述为:首先分别计算ft、ft1、ft-1的值,f表示计算响应,ft代表尺度池s中尺度为1时的响应值,ft1代表尺度池s中尺度为1.025时的响应值,ft-1代表尺度池s中尺度为0.975时的响应值,t的下标代表尺度池中对应尺度值;更具体表示为:步骤1:ftft1且ftft-1此时确定目标尺寸没有发生变换步骤2:当ft1ft时,确定目标尺寸变大;此时再计算ftn的值并比较ft1与ftn,若ft1ftn则代表目标最佳尺寸在1,1.1],从t2升序搜索;若ft1ftn且ftn-ft1rr取0.2,则代表目标尺寸存在变化,此时从tn+1升序搜索获得最佳尺寸,反之则表明最佳尺寸在1,1.1]区间内并距离tn较近,从tn-1降序搜索快速求得最佳尺寸;步骤3:当ft-1ft时,确定目标尺寸变小;3模型更新策略与重检测机制;模型更新策略采用每一帧皆线性加权的方式,公式如下;其中а代表更新后的模型,аt-1代表历史模板,аt代表当前帧模型,η为学习因子,η=0.012;学习因子是模型更新过程中最重要的参数,学习因子的值越大,模型中历史信息越少;α=1-ηαt-1+ηαt通过判断响应图的波动情况确定目标跟踪状态的好坏,使用APCE作为判断响应图的波动情况,Fmax,Fmin,表示响应矩阵中的最大值与最小值,Fw,h表示响应矩阵中w,h位置对应的响度值,当APCE的值大于等于其历史平均值的0.7倍时,代表响应图的波动较小,此时更新跟踪模型,即η值不变;而当APCE的值小于其历史平均值的0.7倍时,代表响应图的波动较大,表明目标可能被遮挡或者丢失,此时需要进行遮挡与丢失的判断; 使用旁瓣峰检测区分遮挡与丢失状态,Fmax表示响应最大值,Fsp表示局部最大值即旁瓣峰,R代表响应矩阵,k代表惩罚因子,k取0.4;若响应矩阵中存在局部最大值且该值大于等于Fmax乘以比例k时,认为目标丢失;当目标丢失,需进行重检测;否则目标被遮挡,模型不更新,即η置为1; 通过重检测来重新确定目标位置,以丢失的目标框为中心,扩大采样区域,扩大后的采样区域为算法原来采样区域的两倍,并通过双线性插值的方式将其尺度变换到初始采样区域的大小后计算其响应值ftnew,得到最大响应对应的坐标后再通过双线性差值的方式进行反变换,即得到最终位置;模型更新策略与重检测机制如下表示:当APCE大于其历史平均值的0.7倍时,此时断定跟踪状态良好,模型更新;反之,此时再判断是否存在Fsp并且该值大于Fmax一定比例k,若成立,则认为目标被遮挡,模型不更新,若不成立,则认为目标丢失;当判定为丢失状态时,开启重检测模块,计算重检测后最大响应值ftnew并与当前响应值ft比较,如果ftnewft,代表重检测到目标,此时将新模型纳入更新,反之产生误判,模型不予更新。

全文数据:

权利要求:

百度查询: 北京工业大学 一种改进的核相关滤波跟踪算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术