买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉理工大学
摘要:本发明公开了一种基于改进YOLOv3的夜间红外行人检测方法及系统,使用复数红外相机采集复数红外行人检测数据集并对数据集进行像素值对比度增强处理,增加行人像素值并减少背景像素值;基于YOLOv3改进并构建夜间红外行人检测网络模型YOLOv3‑SAB,引入stem下采样模块和非对称卷积提高网络特征提取能力和特征表达能力,引入瓶颈残差减少模型中计算参数、提高模型行人检测速度;使用均值聚类算法聚类生成特定地先验瞄框,提升模型目标定位精度;应用CIoU作为YOLOv3‑SAB网络边界框回归损失函数,加快模型收敛、提升预测框准确度;训练YOLOv3‑SAB网络生成夜间红外行人检测模型;使用夜间红外行人检测模型在夜间进行实时红外行人检测。本发明有效提升了针对夜间行人的检测精度和检测速度。
主权项:1.一种基于改进YOLOv3的夜间红外行人检测方法,其特征在于,包括以下步骤:步骤1:构建深度学习目标检测网络YOLOv3-SAB,负责提取行人样貌特征及行人头部、身体和四肢轮廓特征;所述深度学习目标检测网络YOLOv3-SAB,是基于YOLOv3神经网络的改进网络;其中,使用下采样模块stem代替YOLOv3神经网络中特征提取网络部分中的卷积核为3×3、步幅为2的下采样卷积;所述stem模块由两条支路并连组成,一条支路对上一次输出的特征进行1×1、步幅为1和3×3、步幅为2的卷积操作,另一条支路对上一次输出的特征进行2×2、步幅为2的最大池化操作,将两条支路输出的特征图相加并保持通道数不变,获得融合后的特征图;使用瓶颈残差模块替换YOLOv3神经网络中特征提取网络部分中的残差模块,并将瓶颈残差模块中的3×3、步幅为1的卷积替换为非对称卷积;所述瓶颈残差模块由两条支路并连组成,一条支路首先使用1×1、步幅为1的卷积进行通道数量压缩,再利用非对称卷积进行特征提取,保持通道数量不变,最后通过进行1×1、步幅为1的卷积将通道数量还原,另一条支路进行短路连接,将两条支路输出的特征图相加并保持通道数不变,获得融合后的特征图;使用非对称卷积替换瓶颈残差模块中3×3、步幅为1的卷积,非对称卷积对上一次输出的特征图分别进行卷积核尺度为3×3、3×1和1×3的卷积操作和归一化处理,将分别经过上述三种卷积操作和归一化处理后的三个特征图融合并保持通道数不变,最后使用Relu激活函数激活;步骤2:训练深度学习目标检测网络YOLOv3-SAB;具体包括以下子步骤:步骤2.1:使用复数红外相机在不同视角和场景下采集复数行人红外视频数据,将所述复数行人红外视频数据逐帧提取为复数红外图片数据,选取所述复数红外图片数据制作为红外行人检测数据集;对所述复数红外图片数据进行增强处理,增加行人的灰度值并减小背景的灰度值,对所述复数红外图片数据中行人目标的位置信息、行人尺寸信息和行人类别信息进行影像标注,其中所述行人类别信息依据行人样貌信息、轮廓信息和尺寸信息作为分类依据;步骤2.2:采用均值聚类算法对所述影像标注后的行人尺寸进行聚类,聚类得到针对夜间红外行人检测的先验瞄框尺寸,将所述聚类得到的先验瞄框尺寸替换深度学习目标检测网络YOLOv3-SAB中的原先验框尺寸;步骤2.3:根据步骤2.1中采集得到的红外行人检测数据集,将数据集按照预定比例分配为训练数据集和测试数据集;使用训练数据集对所述深度学习目标检测网络YOLOv3-SAB进行训练,训练过程中深度学习目标检测网络YOLOv3-SAB每进行一轮次迭代生成并保存一个模型权重文件,直至深度学习目标检测网络YOLOv3-SAB达到收敛状态停止训练;深度学习目标检测网络YOLOv3-SAB使用所述模型权重文件作为行人检测权重对测试数据集中所有复数红外图片数据进行侦测,侦测得到测试数据集中的所有行人信息并保存,根据侦测结果和步骤2.1中标注的真实行人信息进行比对计算得到检测精度,选取测试精度最高的模型权重文件作为深度学习目标检测网络YOLOv3-SAB的模型权重;步骤3:将实时采集的复数红外视频图像输入深度学习目标检测网络YOLOv3-SAB,使用步骤2.3中所述模型权重文件作为行人侦测权重对视频数据进行实时行人检测。
全文数据:
权利要求:
百度查询: 武汉理工大学 基于改进YOLOv3的夜间红外行人检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。