首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于数据增量的卷积神经网络前视声呐图像识别方法_广东海洋大学_202210679901.2 

申请/专利权人:广东海洋大学

申请日:2022-06-15

公开(公告)日:2024-06-07

公开(公告)号:CN115082755B

主分类号:G06V10/774

分类号:G06V10/774;G06V10/764;G06V10/82;G06V20/05;G06V10/30;G01S15/89;G01S7/539;G06V20/40;G06V10/26

优先权:

专利状态码:有效-授权

法律状态:2024.06.07#授权;2022.10.11#实质审查的生效;2022.09.20#公开

摘要:本发明公开了一种基于数据增量的卷积神经网络前视声呐图像识别方法,该方法使用五种不同的水下运动目标,所述五种不同的水下运动目标分别为单柱目标、双柱目标、三柱目标、四柱目标和T型目标,所述卷积神经网络前视声呐图像识别技术如下所示:步骤1、从前视声呐原始目标图像中抽取训练集和测试集;步骤2、居中裁剪目标图像并灰度旋转;步骤3、数据增量;步骤4、输入卷积神经网络进行训练;步骤5、得到已训练的卷积神经网络;步骤6、对测试集进行识别分类;本发明不需要繁琐的特征工程,可以极大的减少人工成本并且泛化能力更强,训练速度更快。

主权项:1.一种基于数据增量的卷积神经网络前视声呐图像识别方法,该方法使用五种不同的水下运动目标,其特征在于:所述五种不同的水下运动目标分别为单柱目标、双柱目标、三柱目标、四柱目标和T型目标,所述卷积神经网络前视声呐图像识别方法如下所示:步骤1、从前视声呐原始目标图像中抽取训练集和测试集:通过对实验采集到的五类水下运动目标的前视声纳图像视频进行帧截取获得五类目标图像,抽取部分图像为训练集,再从声呐图像视频中挑选与训练集不重复的图像作为后续神经网络的测试集;步骤2、居中裁剪目标图像并灰度旋转:对原始声呐图像进行居中裁剪并进行灰度转换,滤除掉声呐图像中除了目标以外的其他杂乱信息得到裁剪后的目标灰度图像;步骤3、数据增量:在经过上述对图像的操作步骤之后,基于卷积神经网络对扭曲图像的处理具有识别不变的优良特性,再对目标图像进行间隔10度的顺时针旋转,一共经过360度,每旋转一次角度,就对目标图像进行左右镜像对称、平移、高斯加噪并中值滤波、维纳滤波、桶形变换和针垫变换,得到原始目标的增量图像,每类目标由原始的48张图片增量到15552张,五类目标总计增量到77760张图像;步骤4、输入卷积神经网络进行训练:在将声呐图像数据经过增量处理以后,将其存入到一个新的样本训练集,然后将增量样本集经过一个16层卷积神经网络进行训练,并使用训练集中的35%的卷积神经网络模型进行识别验证;所述一个16层卷积神经网络的每层结构如下所示:输入层--卷积层3,8--批处理层--激活函数--池化层2,2--卷积层3,16--批处理层—激活函数—池化层2,2--卷积层3,32--批处理层—激活函数—池化层2,2--全连接层—归一化层—分类层;步骤5、得到已训练的卷积神经网络:得到训练集经过网络的识别,利用训练集中所划分的测试集对神经网络识别的正确率为99.89%;步骤6、对测试集进行识别分类:对未经训练的测试集的总体识别进行分类,经过计算,对未经训练测试集的识别正确率为99.6129%,再从未经训练的测试集中随机抽取6张图片经网络识别后得到分类结果。

全文数据:

权利要求:

百度查询: 广东海洋大学 一种基于数据增量的卷积神经网络前视声呐图像识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。