买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉东智科技股份有限公司
摘要:本发明涉及计算机视觉技术领域,特别是涉及一种基于DDT深度神经模型结构的监控图像地点信息识别方法,包括步骤:对图像进行预处理;将预处理后的图像应用Deep‑Feature子结构得到图像的特征矩阵;生成与特征矩阵等尺寸的位置矩阵,生成由隶属度向量构成的概率矩阵及其位置矩阵;将特征矩阵及其位置矩阵、概率矩阵及其位置矩阵作为Decoder子结构的输入;得到字符集合中每个字符预测的概率,输出每个隶属度向量中概率值最高的索引值,将索引值替换为字符,作为地点信息识别结果输出。本发明能更好的提取图像的特征,并减少了对字符位置编码的需求。本发明更好利用了图像特征,同时识别与原图像中等长的地点信息,大大增加了识别精度。
主权项:1.一种基于DDT深度模型结构的监控图像地点信息识别的方法,所述DDT为Deepfeature-DecoderTransformer的简写,其特征在于,包括如下步骤:步骤I:对输入的监控图像进行预处理,调整图像尺寸等于深度神经网络的输入维度;步骤II:将预处理之后的图像送入所述DDT深度模型结构的Deep-Feature子结构中,得到监控图像的特征矩阵;步骤III:从标准正态分布N0,1中随机取值,生成与步骤II中特征矩阵等尺寸的位置矩阵,该位置矩阵代表特征矩阵的位置信息;步骤IV:从标准正态分布N0,1中随机取值,生成由隶属度向量构成的概率矩阵;以相同的取值方法,生成与概率矩阵等尺寸的位置矩阵,该位置矩阵代表概率矩阵的位置信息;步骤V:载入深度神经网络模型,将特征矩阵及其位置矩阵、概率矩阵及其位置矩阵作为Decoder子结构的输入,对特征矩阵进行循环解码,计算识别结果的概率矩阵;步骤VI:使用线性映射矩阵将步骤V的结果映射至t维,其中t等于字符集合S={s1,s2,.......st,}的大小,得到模型对字符集合中每个字符预测的概率;输出每个隶属度向量中概率值最高的索引值,根据字符集合中索引值与字符映射关系,将索引值替换为字符,作为地点信息识别结果输出。
全文数据:
权利要求:
百度查询: 武汉东智科技股份有限公司 基于DDT深度神经模型结构的监控图像地点信息识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。