首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于长尾数据的自适应阈值NMS多目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:长讯通信服务有限公司

摘要:本发明公开了一种基于长尾数据的自适应阈值NMS多目标检测方法,包括以下步骤:步骤一,输入目标检测的长尾训练数据,分析和计算数据特征;步骤二,采用FasterRCNN模型训练目标检测模型;步骤三,把需要检测的长尾目标检测数据输入FasterRCNN目标检测模型,获取多个目标候选框;步骤四,根据长尾训练数据的数据特征,对每一个类别进行自适应阈值计算,并执行非极大值抑制处理;步骤五,根据步骤四的方法,对所有类别的待检测框进行冗余框筛选,获得目标检测结果,本发明考虑了目标检测实际应用中广泛存在的长尾数据现象,自适应调整非极大抑制算法的阈值,从而保护尾部类别目标检测框不被过度抑制,可有效降低尾部类别目标的漏检率。

主权项:1.一种基于长尾数据的自适应阈值NMS多目标检测方法,其特征在于,包括以下步骤:步骤一,输入目标检测的长尾训练数据,分析和计算数据特征,所述分析和计算数据特征,包含以下操作:根据长尾数据的特征,计算每一类目标的平衡系数,公式如下: (1)其中,是长尾数据中目标类别的数量;是第i类目标的总数量;步骤二,采用FasterRCNN模型训练目标检测模型,包含以下操作:定义一个瓶颈层bottleneck,其中一条支路依次通过卷积核大小为1x1的组卷积层、正则化BN层、卷积核大小为3x3的组卷积层、正则化BN层、卷积核大小为1x1的卷积层、正则化BN层、relu激活函数,另一条支路是恒等映射,两条支路的输出相加得到bottleneck的输出;把训练集中的图片归一化输入regnet骨干网络,依次经过卷积核大小为3x3、步长为2、填充为1、输出通道为48的卷积层,正则化BN层,激活函数relu,经过2个输出通道为96的bottleneck得到特征图C2,经过6个输出通道为192的bottleneck得到特征图C3,经过15个输出通道为432的bottleneck得到特征图C4,经过2个输出通道为1008的bottleneck得到特征图C5;步骤三,把需要检测的长尾目标检测数据输入FasterRCNN目标检测模型,获取多个目标候选框,将所有目标候选框按照不同的类别标签分组,并对每一个类别的所有目标候选框按照置信度进行排序;步骤四,根据长尾训练数据的数据特征,对每一个类别进行自适应阈值计算,并执行非极大值抑制处理,所述对每一个类别进行自适应阈值计算,包含以下操作:对每一个目标类别,计算该类别的非极大值抑制算法阈值参数,公式如下: (2)其中,是长尾数据中目标类别的数量;是长尾数据的平衡系数;是可调节的权重系数,所述执行非极大值抑制处理,包含以下操作:(a)在每一类目标中,选择置信度最高的目标检测框,记作M,加入到集合D中;(b)分别计算剩余的目标检测框与M之间的交并比,并按照以下公式处理该目标检测框的置信度,公式如下: (3)其中,表示第i类检测目标的第j个检测框,是第i类检测目标的检测框数量;是检测框M与第j个检测框的交并比;(c)若步骤(b)中得到的所有类别的目标检测框为空,则检测框筛选结束;步骤五,根据步骤四的方法,对所有类别的待检测框进行冗余框筛选,获得目标检测结果。

全文数据:

权利要求:

百度查询: 长讯通信服务有限公司 一种基于长尾数据的自适应阈值NMS多目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。