首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度学习的指针仪表读数识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广东工业大学

摘要:本发明公开了一种基于深度学习的指针仪表读数识别方法,包括:获取原始指针仪表图像并进行预处理,获得处理后的指针仪表数据集;构建初始指尺提取网络模型,基于处理后的指针仪表数据集对指尺提取网络模型进行训练,获得目标指尺提取网络模型;基于训练后的指尺提取网络模型对待识别指针仪表图像进行识别,获得无背景指针与尺度仪表的图像识别结果。本发明采用深度学习机器视觉技术代替人工阅读,不仅提高了工作场所的安全性,降低了人力资源的耗费,而且通过自动化数据收集过程提高了效率和准确性。

主权项:1.一种基于深度学习的指针仪表读数识别方法,其特征在于,包括:获取原始指针仪表图像并进行预处理,获得处理后的指针仪表数据集;构建初始指尺提取网络模型,基于所述处理后的指针仪表数据集对初始指尺提取网络模型进行训练,获得目标指尺提取网络模型;基于所述训练后的目标指尺提取网络模型对待识别指针仪表图像进行识别,获得无背景指针与尺度仪表的图像识别结果;基于所述训练后的目标指尺提取网络模型对待识别指针仪表图像进行识别的过程包括:基于指针仪表特征提取模块提取指针仪表图像特征;基于多尺度特征图融合模块提取多尺度指针仪表图像特征;基于指针仪表自适应特征提取模块还原原始指针仪表图像空间结构;所述基于指针仪表特征提取模块提取指针仪表图像特征的过程包括:将像素大小为512×512,3通道的原始指针仪表图像Y输入所述指针仪表特征提取模块,先由大小为1×1的卷积核进行卷积操作,得到像素大小为256×256,32通道的浅层指针仪表特征图F1;将所述浅层指针仪表特征图F1输入至第一个混合空洞卷积注意力块MDCABlock中进行处理,获得像素大小为128×128,64通道的中层指针仪表特征图F2;将所述中层指针仪表特征图F2输入至第二个混合空洞卷积注意力块MDCABlock中进行处理,获得空洞激活特征图R2;将所述空洞激活特征图R2输入至第二个混合空洞卷积注意力块MDCABlock的DECA注意力模块进行处理,获得像素大小为64×64,128通道的深层指针仪表特征图F3,然后将所述深层指针仪表特征图F3输入多尺度特征图融合模块;将所述浅层指针仪表特征图F1输入至第一个混合空洞卷积注意力块MDCABlock以及指针仪表自适应特征提取模块中的过程包括:将所述浅层指针仪表特征图F1输入混合空洞卷积注意力块MDCABlock中,首先经大小为3×3、空洞率为1的卷积核处理后,进入归一化与ReLU激活函数层;再进入大小为3×3、空洞率为2的卷积核处理层,归一化与ReLU激活函数层;再进入大小为3×3、空洞率为3的卷积核处理层,归一化与ReLU激活函数层;最后经过3×3卷积操作得到空洞激活特征图R1,进入DECA注意力模块,通过所述DECA注意力模块捕获指针仪表图像数据的全局信息;通过所述DECA注意力模块捕获指针仪表图像数据的全局信息的过程包括:以进入DECA注意力模块的空洞激活特征图R1为输入在空间维度上使用,平均池化与最大池化两个并行池化进行空间特征压缩,获得长度为C的一维向量;对所述一维向量进行一维卷积,并经过Sigmoid激活函数得到各个通道的权重ω,将所述权重ω与原始特征图F相乘获得特征图;公式表达式为: 式中:表示全局平均池化,表示最大池化;表示滤波器大小为3×3的卷积操作,表示卷积核大小为的一维卷积;表示Sigmoid激活函数;表示逐元素乘积;其中中一维卷积核的大小的计算公式为: 式中:表示的最接近奇数,表示输出特征的通道数,和都是超参数;所述基于多尺度特征图融合模块提取多尺度指针仪表图像特征的过程包括:将深层指针仪表特征图F3进行1×1卷积操作,得到特征图M1、空洞率为12的特征图M2以及空洞率为24的特征图M3;将所述特征图M1、特征图M2以及特征图M3在通道维度上进行拼接,获得具有大规模全局信息和小规模局部细节信息的多特征融合特征图M4;其中,所述特征图M1、特征图M2以及特征图M3的像素大小为64×64,128通道;所述多特征融合特征图M4的像素大小为64×64,128×3通道;将所述多特征融合特征图M4进行3×3卷积后,所述多特征融合特征图M4的像素大小与中层指针仪表特征图F2一致,获得像素大小为128×128,128通道的多尺度特征图F4,并将所述多尺度特征图F4输入至指针仪表自适应特征提取模块中;所述基于指针仪表自适应特征提取模块还原原始指针仪表图像空间结构的过程包括:将多尺度特征图F4与中层指针仪表特征图F2连接,包括所述中层指针仪表特征图F2通过1×1卷积将特征映射的通道调整为128,得到指针仪表特征图F5;将所述指针仪表特征图F5与所述多尺度特征图F4通过1×1卷积操作在通道维度上进行拼接,获得指针仪表特征图F6;将所述指针仪表特征图F6通过双线性重塑将像素大小调整为与浅层指针仪表特征图F1的像素大小相同,获得像素大小为256×256,128通道的指针仪表特征图F7;所述浅层指针仪表特征图F1通过1×1卷积将特征映射的通道调整为128,得到指针仪表特征图F8,然后所述指针仪表特征图F8与指针仪表特征图F7执行连接操作和1×1卷积,获得大小为256×256,256个通道的指针仪表特征图F9;将所述指针仪表特征图F9输入自调整卷积层中,提取不规则指针与尺度形状的特征,再经过1×1卷积和双线性重塑后,输出1个通道、512×512像素大小的最终指尺提取结果;将所述指针仪表特征图F9输入自调整卷积层进行处理的过程包括:所述指针仪表特征图F9通过正常卷积层获得位置偏移,然后调制从每个采样点学习到的特征的偏移量和幅度;最后,执行几何变换特征学习过程,计算为: 式中和分别表示位置k处的可学习偏移量和权重标量,为k处的权重,为输入特征图,为输出特征图,表示输出特征图y上的每个位置L,表示卷积核K中一个元素位置偏移;表示[0,1]范围内位置k处的调制标量,并使用双线性插值执行偏移值的计算;和通过将卷积应用于相同的输入特征图层获得;输出通道数为3K,K表示卷积核大小,第一个2K维表示每个位置的f和y偏移量,随后的K维用于根据sigmoid层获得每个位置的权重。

全文数据:

权利要求:

百度查询: 广东工业大学 一种基于深度学习的指针仪表读数识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。