【发明授权】一种基于级联目标检测的指向文字定位方法_杭州电子科技大学_202110471210.9

导航：龙图腾网> 最新专利技术> 一种基于级联目标检测的指向文字定位方法_杭州电子科技大学_202110471210.9

申请/专利权人：杭州电子科技大学

申请日：2021-04-29

公开（公告）日：2024-06-21

公开（公告）号：CN113378841B

主分类号：G06V30/148

分类号：G06V30/148;G06V30/19;G06V30/14;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2021.09.28#实质审查的生效;2021.09.10#公开

摘要：本发明公开了一种基于级联目标检测的指向文字定位方法，包括以下步骤：步骤S1：数据生成及预处理；步骤S2：创建模型并训练；步骤S3：训练好网络后，利用实际摄像头拍摄的图像，经预处理后输入网络，得出标志物在图像中的位置和大小，以及指向单词文字坐标和大小。与现有技术相比，本发明采用基于级联深度神经网络的目标检测技术，精确地定位指向文字的区域，为字符识别提供可靠的文字区域，大大提高字符识别的精度。

主权项：1.一种基于级联目标检测的指向文字定位方法，其特征在于，包括以下步骤：步骤S1：数据生成及预处理；步骤S2：创建模型并训练；步骤S3：训练好网络后，利用实际摄像头拍摄的图像，经预处理后输入网络，得出标志物在图像中的位置和大小，以及指向单词文字坐标和大小；其中，所步骤S1包括：步骤S11：合成训练集，采集标志物图像，生成单词字符，把标志物图像随机移动放缩放置到某个单词下面，生成一张训练用的图像；步骤S12：利用已知的标志物和单词位置大小信息，得到标志物的位置大小信息VMLoc＝[xm,ym,wm,hm]，分别表示以标志物顶端中心的横纵坐标以及标志物的宽度高度；以及指向单词信息VWLoc＝[xw,yw,ww,hw]，分别表示指向单词在裁剪图的横纵坐标和大小；步骤S13：建立训练用的groundtruth数据，也即，建立标志物出现位置大小信息，以预测标志物和指向单词两个标签的信息；所述步骤S2包括：步骤S21：建立深度神经网络，采用通用的ResNet-18为主干网络，采用级联两级网络输出两个目标的信息：第一级网络输出标志物的概率、位置和大小回归预测，第二级网络输出指向单词的位置和大小回归预测；步骤S22：将原始高分辨率图像缩放到224×224大小的图像输入网络，通过卷积层、池化层和激活层输出最后的标志物信息，第一级输出预测的大小是1×5，用于预测标志物是否出现的概率和标志物的位置大小，再依据标志物，截取感兴趣区域图像输入到第二级网络，输出指向单词文字的位置坐标和大小；步骤S23：先训练标志物网络，也即第一级网络，采用全图预测出标志物，再依据标志物的位置信息裁剪第一级前面的特征图送入第二级网络进行指向单词的预测，以让级联的网络都能训练稳定；步骤S24：把训练样本和目标真实值不断地输入到网络，使用误差反向传播进行每一层网络参数的调整，不断的迭代训练，最终实现收敛，得到网络模型；其中，深度神经网络要实现对两类的样本的预测，每种样本对应的损失也是不同的，所以在最后要融合不同类型的损失，再驱动网络更新，最终是让总损失趋于最小，直到损失稳定不动，网络训练结束；在所述步骤S24中，第一级网络总的损失函数有两个部分，第一部分是标志物的预测概率损失，采用交叉熵损失函数：LossMProb＝glogp+1-plog1-g其中，g是标志物出现的真实概率，值为0或者1，p是标志物的预测概率，其已经经过Softmax函数激活；第二部分是标志物的位置和大小的预测损失，采用SmoothL1损失函数：其中，x为预测位置大小与真实值差值，SmoothL1损失函数，其对离群点、异常值不敏感，梯度变化相对更小，训练时更平稳；最后总损失函数如下：LossM＝αLossMProb+βLossMLocα是对标志物概率损失的权重，β是标志物位置大小损失的权重；第二级网络是指向单词的预测损失，也是采用SmoothL1损失函数，记为LossWLoc。

全文数据：

权利要求：

百度查询：杭州电子科技大学一种基于级联目标检测的指向文字定位方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：轮胎磨损监测方法及系统_摩登汽车有限公司_202210397941.8

下一篇：外肢体机器人作业策略半物理仿真方法及系统_山东大学_202111470212.2

相关技术

轮胎磨损监测方法及系统_摩登汽车有限公司_202210397941.8

外肢体机器人作业策略半物理仿真方法及系统_山东大学_202111470212.2

一种采棉机摘锭座管测量装置_浙江亚嘉采棉机配件有限公司_202410465107.7

一种发动机仿真模型的精度评估方法、装置以及电子设备_西安航天动力研究所_202410282665.X

一种基于草料的饲料制造用粉碎方法_张向红_202210570360.X

一种双层保温日光温室_山东同岚农业发展集团有限公司_202410511060.3

利拉鲁肽的合成_拜康有限公司_201780086325.8

一种配电网低压无功补偿电容状态检测方法及装置_广东电网有限责任公司_202210780379.7

一种羽毛片自动翻正装置_汪锐_202111663818.8

基于学生T过程的微带天线优化方法和优化系统_江苏科技大学_202111415452.2

点云处理的方法、系统、电子设备及计算机可读存储介质_合众新能源汽车股份有限公司_202210573918.X

一种聚丙烯复合材料及其制备方法和应用_广东聚石化学股份有限公司_202211721781.4

指向相关技术

一种光路对准指向调节机构_南京林业大学_202420202641.4

一种基于级联目标检测的指向文字定位方法_杭州电子科技大学_202110471210.9

一种空间指向性网络的拓扑规划方法_南京大学_202410259049.2

具备箭头指向的机器人反光膜感知贴片组_昆山金瑞安电子科技有限公司_202420238947.5

低功率指向方法以及实现该指向方法的电子设备_意法半导体股份有限公司_202010749199.3

声源指向性测试装置_比亚迪股份有限公司_202322943833.9

一种指向性波动激发与探测的频率-波数压电纤维换能器_上海交通大学_202410461990.2

一种主瓣指向可调的频率不变宽带波束形成器设计方法_南京航空航天大学_202211616340.8

一种高精度光学器件指向性测试装置_维林光电(苏州)有限公司_202323178275.8

动态指向式旋转导向钻井工具的自适应工具面角估计方法_中国石油大学(华东)_202210329754.6

文字相关技术

一种文字输入方法、设备及计算机可读存储介质_努比亚技术有限公司_201910360044.8

一种文字复制方法、装置、电子设备及可读存储介质_珠海金山办公软件有限公司_202010383237.8

一种基于安卓的文字编辑方法和装置_杭州思代尔阿特科技有限公司_202011317494.8

一种基于级联目标检测的指向文字定位方法_杭州电子科技大学_202110471210.9

一种具有导轨防护结构的文字喷印设备_东莞市森泉精密设备有限公司_202323332661.8

基于电子文档的图片和文字对照展示方法及装置_新长城科技有限公司_202110873460.5

基于分块编码与Transformer的中文字形字库自动生成方法及系统_北京大学_202111635060.7

一种用于体育比赛直播文字的体育新闻构建方法及系统_北京奥邦菲特科技有限公司_202311570259.5

一种调整文字显示颜色的控制方法及装置_上海二三四五网络科技有限公司_202011549112.4

一种面向文字识别的图像质量自动评估方法及系统_山东浪潮科学研究院有限公司_202410612009.1

检测相关技术

检测装置_国家能源集团国源电力有限公司_202323196828.2

检测设备_深圳市燕麦科技股份有限公司_202323139176.9

一种检测发动机活塞突出高度的检测装置及其检测方法_玉柴联合动力股份有限公司_201911154631.8

力检测设备、力检测系统以及力检测设备的制造方法_横河电机株式会社_202111002982.4

基底检测装置和使用该基底检测装置的基底检测方法_三星显示有限公司_202311735620.5

一种便于PCB板检测的PCB板检测装置及检测方法_深圳市联创电路有限公司_202410336675.7

一种外观检测设备及待检测产品的外观检测方法_博众精工科技股份有限公司_201910234757.X

皮肤检测方法、皮肤检测装置、皮肤检测系统和存储介质_广东花至美容科技有限公司_202410482824.0

阴茎勃起全向应力检测环、检测装置及其无线检测方法_青岛华仁医疗用品有限公司_202410242643.0

一种疫苗抗体检测卡及检测系统及其检测方法_天津科德生物科技有限公司_202410341740.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于级联目标检测的指向文字定位方法_杭州电子科技大学_202110471210.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务