首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种提升OCR识别速度的方法 

申请/专利权人:北京君正集成电路股份有限公司

申请日:2022-12-27

公开(公告)日:2024-06-28

公开(公告)号:CN118262359A

主分类号:G06V30/148

分类号:G06V30/148;G06V30/19

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明提供一种提升OCR识别速度的方法,包括:S1标注字间空格数据:由于空格检测的目标是字与字之间的空格,将OCR的训练数据中的字间空格标注出来;由于训练模型的高固定为32,宽不定,故这里的数据都是高为32、宽不等的一行字的图片,中文若字间隔5以上即认为是空格标注出来,英文中单词之间也标注为空格;S2训练字间空格模型:采用DBNet框架,所述DBNet检测出文字的位置也能够检测出字间空格的位置;网络输出空格的位置和得分,所述得分为0到1之间的浮点数,所述得分越高说明是空格的可能性越大,且空格个数不限;S3挑选空格做分割:根据筛选条件选择合适的空格结果做分割。在不影响识别精度的基础上提升OCR的识别速度,可减少至一半或者三分之一。

主权项:1.一种提升OCR识别速度的方法,其特征在于,所述方法包括以下步骤:S1.标注字间空格数据:由于空格检测的目标是字与字之间的空格,所以将OCR的训练数据中的字间空格标注出来;由于训练模型的高固定为32,宽不定,故这里的数据都是高为32、宽不等的一行字的图片,中文若字间隔5以上即认为是空格标注出来,英文中单词之间也标注为空格,这里的数字的单位是像素;S2.训练字间空格模型:采用DBNet框架,所述DBNet检测出文字的位置也能够检测出字间空格的位置;网络输出空格的位置和得分,所述得分为0到1之间的浮点数,所述得分越高说明是空格的可能性越大,且空格个数不限,可根据需要设置,假设设置的0.8,即得分大于0.8则认定是空格;S3.挑选空格做分割:选择合适的空格结果做分割,筛选条件如下:S3.1,图片长大于1000的才会进行空格检测进行分割,小于1000则时间能够接受无需做分割,这里的数字的单位是像素;S3.2,需要做分割的图片进行空格检测,若有结果则对结果进行选优,先卡得分为0.8,且数量最多选两个,数量为1时选择靠中间的得分高的空格对图片进行分割,选2个时,让图片三段等分,这样使得分割后的片段长度不至于太短;S3.3,选择好空格检测后,求出四边形的中心点;S3.4,设扫描笔的扫描是从左往右,在扫描的过程中会一直进行检测识别,每次送入识别的图是从开始扫描的位置到当前扫描的位置,假设按128长度送图,图长为384,总共送三次图,最终OCR的识别时间为图长384的检测时间+识别时间,这里的数字的单位是像素;加入分割后,假设只有中间那个空格满足要求,则所述扫描笔送图,这时OCR的识别时间为图长为3842=192的检测时间+空格检测时间+识别时间,由于空格检测时间只有3ms,识别时间长,长的可达1s,所以识别时间近似减半,识别结果为前一次的识别结果加最后的识别结果。

全文数据:

权利要求:

百度查询: 北京君正集成电路股份有限公司 一种提升OCR识别速度的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。