首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于OCR识别的文本字符分割方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:合肥高维数据技术有限公司

摘要:本发明特别涉及一种基于OCR识别的文本字符分割方法,包括如下步骤:S100、使用OCR算法对文本进行识别得到索引、内容和置信度信息;S200、对任一文本检测行,进行漏识别字符添加并确定所有字符索引位置;S300、对上述索引位置进行处理得到每个字符的位置信息;S400、对内容为符号的字符位置信息进行偏移调整;S500、根据相邻的两个位置信息计算分割位置;S600、根据分割位置对字符进行分割和切边得到每个字符的边框信息;S700、根据每个字符的置信度信息以及边框大小剔除噪点,余下的即为正确分割的字符。这里根据已有成熟算法的输出结果进行一系列处理,从而实现对文本中字符的准确分割,分割时不会遗漏字符且分割位置非常精准。

主权项:1.一种基于OCR识别的文本字符分割方法,其特征在于:包括如下步骤:S100、使用OCR算法对文本进行识别得到索引、内容和置信度信息;S200、对任一文本检测行,根据索引的内容及置信度信息对漏识别字符进行添加后再记录非空内容置信度最大处的索引位置;S300、对上述索引位置进行处理得到每个字符的位置信息{x1,x2,...,xn};S400、根据字符内容对内容为符号的字符位置信息进行偏移调整,调整后的位置信息为{x′1,x′2,...,x′n};S500、根据位置信息x′i和x′i+1计算分割位置yi,其中i∈{1,2,...,n-1},包括如下步骤:S510、根据位置信息x′i和xi+1计算中心位置zi,0;S520、记zi,0朝向x′i一侧偏移的位置分别为{zi,-1,zi,-2,...,zi,-m},zi,0朝向x′i+1一侧偏移的位置分别为{zi,1,zi,2,...,zi,m};S530、计算所有zi,j位置处一列像素中空白位置像素的占比Pi,j,其中j∈{-m,-m+1,...,m-1,m};S540、Pi,j取最大值时所对应的位置即为分割位置yi;S600、根据行首位置y0、行尾位置yn以及步骤S400计算得到的分割位置yi对该行中的字符进行分割和切边得到每个字符的边框信息;S700、根据每个字符的置信度信息以及边框大小剔除噪点,余下的即为正确分割的字符。

全文数据:

权利要求:

百度查询: 合肥高维数据技术有限公司 基于OCR识别的文本字符分割方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术