一种基于YOLOv5和GME的采样方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：成都云擎科技有限公司

摘要：本发明公开了一种基于YOLOv5和GME的采样方法。该发明是一种全局运动补偿与目标检测算法YOLOv5相结合的采样阶段预处理模块，针对镜头大幅度运动下的视频行为识别任务进行算法改进。该模块算法与基于光流的全局运动补偿算法有以下不同：一是用视频帧压缩域已有的运动矢量替换Brox光流进行，大大降低了获得数据的计算量和耗时；二是添加行人检测算法YOLOv5切割出人体存在区域，使得全局运动的估计不被人体的局部运动所影响，随后计算出背景的全局运动，反馈到整个视频帧中消除全局运动对行为识别的负面影响。本发明在公开数据集上验证并比较新算法和原算法的效果，实验结果表明该采样方法较原方法有效的保证了行为识别的实时性，同时明显改善了行为识别在镜头大幅度运动下的视频中的识别准确率。

主权项：1.一种基于YOLOv5和GME的采样方法，包括以下步骤：步骤1.运动矢量获取模块，为本专利核心内容。YGME算法将使用帧之间的运动矢量数据替代光流值进行接下来的全局运动估计与补偿。由于视频中的运动矢量在视频解压的过程中就可以直接获得，相较于GME，这样做避免了大量的光流运算Brox光流算法在NVIDIAGPU上的处理速度为一帧0.06s，也就是约16FPS。步骤2.参数运动估计模型，全局运动的参数模型分为四种：二参数模型、四参数模型、六参数模型、八参数模型。四种不同的模型具备的全局运动建模特性不同。从实际应用场景上分析，通常来说，参数的减少意味着准确度的下降，但是在实际的视频人体行为识别中，如果直接基于视频的压缩域运动矢量MPEG来代替相邻两帧图像的光流进行全局运动估计，四参数模型就足以描述其各种运动模式。在本发明中将使用四参数模型估计参数。坐标系将二维图像分为四个区域，右下、左下、左上、右上分别为IIIIIIIV象限。在I象限的像素中取一点，其坐标为aI＝x，yT，x＞0，y＞0，该像素在另外三个像素中关于XY轴以及原点对称的三点分别为aII＝-x，yT，aIII＝-x，-yT，aIV＝x，-yT。基于以上建模，就可以用以下方程来表示全局运动：公式中，aI＝x，yT表示图像帧中的某一像素点，tx和ty代表了XY轴两个方向的摄像机平移运动变量，a1和a2代表了伸缩和旋转的运动变量。根据这四个参数，构筑了全局运动估计的四参数模型，可以根据该四个参数估计摄像机全局运动。在XOY坐标系中，可以用下面的公式表示随机一点的运动矢量：MVPai＝fai|A，T-ai＝A-I×ai+T首先基于视频图像的中心作为原点，构建XOY坐标系，导入其全局运动的矢量数据。步骤3.人体区域分割模块，为本专利的核心思想。为了消除局部运动主要是人体运动对全局运动的错误估计，使用行人检测YOLO算法获取视频帧中的人员存在区域，留下人员存在以外的那部分区域。随后裁去其整张运动矢量图中的对应区域运动矢量，输入剩余区域的运动矢量进行参数估计，估算出整张图的全局运动矢量。最后返还计算出的全局运动矢量，还原出一张没有发生全局运动的运动矢量图。全局运动补偿的公式如下：MVP′ai＝MVPpeopleai-MVPglobalaiMVPpeopleai是人员区域运动矢量数据，为已知值，MVPglobalai是全局运动矢量，根据述四参数模型的算法，MVPglobalai的计算公式如下：MVPglobalai＝Aai+T所以上式可写为：步骤4.整体的采样方案在双流SlowFast结构上进行性能测试。在HMDB51数据集上的实验结果中，51类行为数据中，有48个类别的识别率得到了提升，其中dance、ride、hit等几类提升超过了10％，只在lie-0.1AP、throw-0.2AP、phoning-0.4AP三类上有极小的降低，以Top-5的评价标准来看，其识别的准确率从86.2％提升到了88.3％。除此以外，算法的分类损失函数和整体损失函数比其他采样方法的收敛速度更快。压缩域CGME是基于GME算法提出的为了提升全局运动补偿运行速度的算法。其核心思路在于用视频的运动矢量，也就是MPEG光流来代替需要计算得到的Brox光流，在运动信息的描述显然不如Brox光流，其原因是MPEG光流以16*16的图块描述运动信息，而Brox光流则是像素与像素间的运动信息。但其运算速度有了近百倍的提升从6.6fps到912.3fps，但是实际运行过程并不需要这么快的速度，故而使用一部分资源，利用目标检测算法YOLOv5作为辅助改善CGME算法的准确率。从实验的结果来看，压缩域的YGEM算法以降低一部分识别率的代价下降约1.8％，大大提升了算法的运行速度从6.6fps到86.0fps，使得全局运动补偿在实时应用的场景的有了实际意义。

全文数据：

权利要求：

百度查询：成都云擎科技有限公司一种基于YOLOv5和GME的采样方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

下一篇：自移动设备大区域移动方法、自移动设备及存储介质

相关技术

一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

自移动设备大区域移动方法、自移动设备及存储介质

一种用于光伏板边框的铝合金型材

镭雕装置

一种新型鹅星状病毒疫苗及其制备方法与应用

一种组装单元体用稳态调节控制系统

一种鱼类产卵行为与生态水文指标响应关系量化方法

一种带有短路检测的连接器插针机

一种发动机选配零件装配过程人机交互防错装置及方法

一种基于非周期非均匀缝隙电容加载的环型宽带水平极化全向天线

一种注册终端设备的方法及装置

快速滤波器校准方法

采样相关技术

采样订户拥塞控制_诺基亚通信公司_202410292996.1

兽医采样器_湟源县畜牧兽医站_202323618987.7

园林土壤采样装置_湖北欧鑫科技有限公司_202311461959.0

一种基于环境可多层采样的动物环境检测采样装置_宁波市甬环苑环保工程科技有限公司_202411150786.5

一种底栖微藻的采样装置及采样方法_广东能源集团科学技术研究院有限公司_202311794537.5

一种水质分层采样装置_大连绿森阳光环保科技有限公司_202323543971.4

一种生物样本采样装置_阎海波_202322859231.5

双盖式便捷病毒采样管_广州医科大学附属脑科医院_202323157317.X

一种土壤修复采样装置_韩英_202322898646.3

一种煤炭采样设备_山西省能源职业学校(山西省能源职工教育中心)_202323421407.5

YOLOv相关技术

基于改进YOLOv8的小目标检测追踪方法及系统_新疆大学_202410872630.1

一种基于改进YOLOv3的果树树干识别和定位检测方法_上海科学技术职业学院_202410523804.3

一种基于SDE_YOLOv8的高压导线断散股检测方法_桂林电子科技大学_202410678278.8

一种多尺度蛇形卷积约束YOLOv8的地表裂缝实例分割方法_国能亿利能源有限责任公司黄玉川煤矿_202410693590.4

一种基于改进YOLOv8n网络的茶叶采摘时间预测方法_云南农业大学_202410799020.3

一种基于特征融合的改进YOLOv8n小目标检测方法_北京鼎星科技有限公司_202410908903.3

基于YOLOv5-CS的路面塌陷自动识别方法及设备_南京师范大学_202410809701.3

一种应用YOLOv8模型检索微地图地理要素的方法_兰州交通大学_202410726165.0

一种基于改进YOLOv8模型的小目标检测方法_成都唐源电气股份有限公司_202411143367.9

基于改进YOLOv8网络的无人机绝缘子缺陷检测方法_华南理工大学_202410643800.9

方法相关技术

煤的评价方法和混煤的制备方法以及焦炭的制造方法_杰富意钢铁株式会社_202080019357.8

蚀刻方法_株式会社力森诺科_202280091493.7

图像检测方法、模型训练方法及相关装置_马上消费金融股份有限公司_202410202420.1

测试结构、失效定位方法以及失效分析方法_上海华力微电子有限公司_202410692646.4

资源配置方法、资源发送方法、资源测量方法及电子设备_成都爱瑞无线科技有限公司_202411141003.7

动态密钥生成方法、升级包加密方法、软件升级方法_广汽埃安新能源汽车股份有限公司_202410720762.2

界面显示方法、视频发布方法、视频编辑方法及装置_北京达佳互联信息技术有限公司_202210945497.9

搬运方法_浜松光子学株式会社_202410706496.8

接合体的制造方法及基材的制造方法_株式会社力森诺科_202280086405.4

一种后门攻击方法和防御方法_华中科技大学_202311273829.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于YOLOv5和GME的采样方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务