买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明涉及图像处理领域,揭露了一种基于OCR的表格版式恢复方法,该方法包括:接收用户发出的携带待恢复表格图片的指令;对所述待恢复表格图片进行OCR识别;基于所述识别结果及预设行切割规则对所述待恢复表格图片进行行切割,得到第一切割结果;确定所述第一切割结果对应的表头信息,基于所述表头信息及预设列切割规则对所述第一切割结果进行列切割,得到第二切割结果;基于所述识别结果及所述第二切割结果生成所述待恢复表格图片对应的目标表格,并将所述目标表格发送给所述用户。本发明还揭露了一种电子装置及计算机存储介质。利用本发明,可以提高表格版式恢复的准确性。
主权项:1.一种基于OCR的表格版式恢复方法,适用于电子装置,其特征在于,该方法包括:接收步骤:接收用户发出的表格版式恢复指令,所述表格版式恢复指令包括待恢复表格图片及所述待恢复表格图片的图片类型;识别步骤:对所述待恢复表格图片进行OCR识别得到识别结果,所述识别结果包括多个文本框及各所述多个文本框对应的文本信息;行切割步骤:基于所述识别结果及预设行切割规则对所述待恢复表格图片进行行切割,得到第一切割结果;列切割步骤:基于所述图片类型确定所述第一切割结果对应的表头信息,基于所述表头信息及预设列切割规则对所述第一切割结果进行列切割,得到第二切割结果;及恢复步骤:基于所述第二切割结果生成目标表格结构,将所述多个文本框对应的文本信息写入所述目标表格结构的单元格中,生成所述待恢复表格图片对应的目标表格,并将所述目标表格发送给所述用户;其中,所述基于所述识别结果及预设行切割规则对所述待恢复表格图片进行行切割,包括:按照多个预设角度对所述识别结果中的所述多个文本框进行旋转,对旋转后的所述多个文本框在y轴上进行投影,确定在y轴上所述多个预设角度对应的多个投影区间及多个重叠投影片段;选择所述多个投影区间中投影区间最小,或者,选择所述多个重叠投影片段中重叠投影片段最多的预设角度作为目标角度,确定所述目标角度对应的重叠投影片段;根据所述目标角度对应的重叠投影片段确定在所述目标角度下所述多个文本框的行切割线;及根据所述目标角度下所述多个文本框的行切割线,确定每一行对应的文本框;所述基于所述表头信息及预设列切割规则对所述第一切割结果进行列切割,得到第二切割结果,包括:获取所述第一切割结果的表头信息中的每一个表头元素,在所述每一个表头元素对应的文本框的最右方作垂直切割线;及根据所述垂直切割线对所述第一切割结果进行列切割,得到第二切割结果;所述根据所述垂直切割线对所述第一切割结果进行列切割,得到第二切割结果,还包括:将所述垂直切割线作为第一列切割线;计算所述第一切割结果中每个文本框的中心点,记录中心点在所述第一列切割线内的文本框,计算每一列文本框外框边界点在X轴方向上的平均数及标准差;当所述标准差小于或等于预设标准差阈值时,根据所述平均数调整对应的一列文本框的第一列切割线,生成第二列切割线;及根据所述第二列切割线对所述第一切割结果进行列切割,得到所述第二切割结果;所述将所述多个文本框对应的文本信息写入所述目标表格结构的单元格中,包括:确定与所述目标表格结构中每个单元格对应的多个交集文本框,分别计算所述多个交集文本框面积及所述多个交集文本框与单元格的重叠面积;及当所述重叠面积与所述交集文本框面积的比例超过预设比例阈值时,判断所述交集文本框为与所述单元格对应的目标文本框,将所述目标文本框的文本信息写入所述单元格中。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 基于OCR的表格版式恢复方法、装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。