首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于困难样本增强损失的红外目标识别方法 

申请/专利权人:中国人民解放军海军航空大学

申请日:2024-03-22

公开(公告)日:2024-06-14

公开(公告)号:CN117934820B

主分类号:G06V10/25

分类号:G06V10/25;G06V10/44;G06N3/0464;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本发明公开了一种基于困难样本增强损失的红外目标识别方法,属于数据识别领域。该方法采用的红外目标识别检测模型包括骨干网、颈部和头部,骨干网基于ResNet结构,包括依次连接的卷积层和四个阶段部分;待识别的红外图像作为骨干网的输入图像输入至卷积层,用于提取图像特征;骨干网还包括三个与最末的三个阶段部分分别对应并联设置的注意力增强模块;颈部包括特征金字塔网络,头部包括区域建议网络和结果预测网络。本发明引入了注意力增强模块和基于红外图像物理特性的样本增强损失函数,显著提高了红外目标的识别检测性能。

主权项:1.一种基于困难样本增强损失的红外目标识别方法,所采用的红外目标识别检测模型包括骨干网、颈部和头部,其特征在于:所述骨干网基于ResNet结构,包括依次连接的卷积层和四个阶段部分;待识别的红外图像作为骨干网的输入图像输入至卷积层,用于提取图像特征;骨干网还包括三个与最末的三个阶段部分分别对应并联设置的注意力增强模块;颈部包括特征金字塔网络,头部包括区域建议网络和结果预测网络;其中特征金字塔网络将骨干网提取的图像特征信息进行融合,然后输入至区域建议网络得到感兴趣区域;结果预测网络结合感兴趣区域和图像特征信息来预测目标的位置和类别;四个阶段部分中,第一个阶段部分基于卷积层输出的图像特征,得到一组特征张量,然后输入至第二个阶段部分;对于每一组相对应的注意力增强模块和阶段部分:注意力增强模块的输入与对应的阶段部分的输入特征张量相同,注意力增强模块的输出与阶段部分的输出相乘后作为该组相对应的注意力增强模块和阶段部分的输出;第一组注意力增强模块和阶段部分的输出为第二组注意力增强模块和阶段部分的输入特征张量,第二组注意力增强模块和阶段部分的输出为第三组注意力增强模块和阶段部分的输入特征张量;第一组、第二组和第三组注意力增强模块和阶段部分的输出作为骨干网输出的图像特征信息;所述注意力增强模块包括依次连接的第一部分、第二部分和第三部分;在第一部分中,注意力增强模块将输入特征张量沿通道方向分别进行最大池化和平均池化,然后将最大池化结果和平均池化结果进行拼接卷积,再将拼接卷积结果作为第二部分的输入;第一部分的计算过程为: ;其中,为注意力增强模块的输入特征张量,为卷积核大小为、步长为1、填充值为0的拼接卷积运算,表示沿通道方向的最大池化运算,表示沿通道方向的平均池化运算,为第一部分拼接卷积结果;在第二部分中,通过总体注意力结构得到权值矩阵;具体的,总体注意力结构包括个互注意力结构,计算过程如下: ;其中,为卷积核大小为、步长为1、填充值为0的拼接卷积运算;为经过多尺度池化得到的特征所构成的集合,,表示第个互注意力结构计算; 为第二部分求得的权重矩阵;所述互注意力结构的计算方式为: ;其中,表示指对两个变量进行拼接后的核大小为、步长为1和填充值为1的卷积运算,表示指对两个变量和进行拼接后的核大小为、步长为1和填充值为7的卷积运算,卷积的输入和输出的宽度和高度是相同的;、和分别指通过卷积运算抽象出来的第个查询、键和响应值;在第三部分中,使用输入特征张量和最终权值矩阵的元素乘积作为输出: ;其中,为卷积核大小为、步长为1、填充值为0的拼接卷积运算,为第一部分的输出,为第二部分的输出,为最终权重矩阵,为注意力增强模块的输出;对于上述红外目标识别检测模型,采用样本增强损失函数进行训练;所述样本增强损失函数包括回归损失和分类损失: ;回归损失的计算方式为:首先计算目标的对比度: ;其中,表示训练前对输入图像中人工标注出的目标区域,表示目标的对比度,表示分别位于目标区域上方、下方、左方和右方的背景区域,表示四个方向的背景区域的集合,表示目标区域中像素值为的像素出现的概率,表示背景区域中像素值为的像素出现的概率;然后计算附加增强系数: ;其中,、、为超参数;则对于第个训练样本的样本回归损失的计算方式为: ;其中,为红外目标识别检测模型预测出的该训练样本中的目标区域与人工标注的目标区域之间的交并比,和分别为预测出的目标区域的宽和训练样本中实际目标区域的宽,和分别为预测出的目标区域的高和训练样本中实际目标区域的高;然后计算回归损失,其中,为训练样本总数;分类损失的计算方式为: ;其中,为目标类别总数,是符号函数,若第个训练样本属于第个类别则为1、否则为0,是红外目标识别检测模型预测出的第个训练样本中的目标属于第个类别的概率。

全文数据:

权利要求:

百度查询: 中国人民解放军海军航空大学 基于困难样本增强损失的红外目标识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。