文字图像标注方法、装置及计算机可读存储介质

导航：龙图腾网> 最新专利技术> 文字图像标注方法、装置及计算机可读存储介质

申请/专利权人：平安科技(深圳)有限公司

申请日：2018-11-06

公开（公告）日：2024-06-28

公开（公告）号：CN109685059B

主分类号：G06V30/146

分类号：G06V30/146;G06V30/148;G06V30/24

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2020.11.24#实质审查的生效;2019.04.26#公开

摘要：本发明涉及图像识别技术，揭露了一种文字图像标注方法、装置及计算机可读存储介质，该方法包括：接收原始文字图像；对原始文字图像进行纠偏；对纠偏后的原始文字图像进行行切；通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；对行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；将切割得到的每个单字图像通过OCR系统进行单字识别，并保存单字识别结果；将行文字识别结果与行中所有的单字识别结果进行对比，当判断行文字识别结果与行中所有的单字识别结果相同时，根据行文字识别结果对对应的行切后的原始文字图像进行标注，根据单字识别结果对对应的单字图像进行标注。

主权项：1.一种文字图像标注方法，应用于文字图像标注装置中，其特征在于，所述文字图像标注方法包括：对接收的原始文字图像进行纠偏；对纠偏后的原始文字图像进行行切；通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注；其中，所述对纠偏后的原始文字图像进行行切的步骤包括：获取所述纠偏后的原始文字图像中文字区域的每个连通域的重心坐标，生成坐标集合；连接所述坐标集合中同一行中第a个重心坐标和第a+1个重心坐标而得到行连通域，其中所述a为自然数；根据所述行连通域获得所述行连通域的轮廓曲线；根据所述轮廓曲线将所述纠偏后的原始文字图像中对应的像素映射至空白图像中得到行切后的原始文字图像。

全文数据：文字图像标注方法、装置及计算机可读存储介质技术领域本发明涉及图像识别领域，尤其涉及一种文字图像标注方法、装置及计算机可读存储介质。背景技术目前很多在深度学习神经网络文字识别的训练的过程中，需要大量的标注数据，目前大部分图像数据都是由人工进行数据标注，人工标注的数据费用较高，且耗费时间较长，标注的数据准确性也不高。发明内容本发明提供一种文字图像标注方法、装置及计算机可读存储介质，其主要目的在于提高图片标注的准确性。为实现上述目的，本发明提供一种文字图像标注方法，应用于文字图像标注装置中，所述文字图像标注方法包括：对接收的原始文字图像进行纠偏；对纠偏后的原始文字图像进行行切；通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注。可选地，所述对接收的原始文字图像进行纠偏的步骤包括：根据用户在所述原始文字图像的同一边缘处选取的至少两个校准点获取所述校准点的坐标；根据所述坐标计算所述原始文字图像的倾斜角的角度；根据所述倾斜角的角度对所述原始文字图像执行旋转校正。可选地，所述对纠偏后的原始文字图像进行行切的步骤包括：获取所述纠偏后的原始文字图像中文字区域的每个连通域的重心坐标，生成坐标集合；连接所述坐标集合中同一行中第a个重心坐标和第a+1个重心坐标而得到行连通域，其中所述a为自然数；根据所述行连通域获得所述行连通域的轮廓曲线；根据所述轮廓曲线将所述纠偏后的原始文字图像中对应的像素映射至空白图像中得到行切后的原始文字图像。可选地，所述对所述行切后的原始文字图像进行单字切割的步骤是通过利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。可选地，当判断所述行文字识别结果与所述行中所有的单字识别结果不同时，将所述行切后的原始文字图像及所述切割得到的每个单字图像通过所述OCR系统进行再次识别。本发明还提供一种文字图像标注装置，所述文字图像标注装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的文字图像标注程序，所述文字图像标注程序被所述处理器执行时实现如下步骤：对接收的原始文字图像进行纠偏；对纠偏后的原始文字图像进行行切；通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注。可选地，所述对接收的原始文字图像进行纠偏的步骤包括：根据用户在所述原始文字图像的同一边缘处选取的至少两个校准点获取所述校准点的坐标；根据所述坐标计算所述原始文字图像的倾斜角的角度；根据所述倾斜角的角度对所述原始文字图像执行旋转校正。可选地，所述对纠偏后的原始文字图像进行行切的步骤包括：获取所述纠偏后的原始文字图像中文字区域的每个连通域的重心坐标，生成坐标集合；连接所述坐标集合中同一行中第a个重心坐标和第a+1个重心坐标而得到行连通域，其中所述a为自然数；根据所述行连通域获得所述行连通域的轮廓曲线；根据所述轮廓曲线将所述纠偏后的原始文字图像中对应的像素映射至空白图像中而得到行切后的原始文字图像。可选地，所述对所述行切后的原始文字图像进行单字切割的步骤是通过利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有文字图像标注程序，所述文字图像标注程序可被一个或者多个处理器执行，以实现上述的文字图像标注方法的步骤。本发明提供的文字图像标注方法、装置及计算机可读存储介质，通过OCR系统识别行文字图像及单字图像，并将识别结果进行对比，如果对比几个相同则对行文字图像及单字图像进行标注，从而提高了标注的准确性。附图说明图1为本发明一实施例提供的文字图像标注方法的流程示意图；图2为本发明一实施例提供的文字图像标注装置的内部结构示意图；图3为本发明一实施例提供的文字图像标注装置中文字图像标注程序的模块示意图。本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。具体实施方式应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。本发明提供一种文字图像标注方法。参照图1所示，为本发明一实施例提供的文字图像标注方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和或硬件实现。在本实施例中，文字图像标注方法包括：S101，对接收的原始文字图像进行纠偏；S102，对纠偏后的原始文字图像进行行切；S103，通过OCROpticalCharacterRecognition，光学字符识别系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；具体地，文字识别过程为：OCR系统利用识别算法分析文字形态特征，判断出汉字的标准编码；S104，对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；S105，通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；S106，将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注。可选地，所述步骤S101包括：根据用户在所述原始文字图像的同一边缘处选取的至少两个校准点获取所述校准点的坐标；根据所述坐标计算所述原始文字图像的倾斜角的角度；根据所述倾斜角的角度对所述原始文字图像执行旋转校正。例如，在所述原始文字图像的水平边缘选取两个校准点，并获取所述校准点的坐标；根据所述坐标计算所述原始文字图像的倾斜角的角度，根据所述倾斜角的角度对所述原始文字图像旋转校正至水平位置。可选地，所述步骤S102包括：获取所述纠偏后的原始文字图像中文字区域的每个连通域的重心坐标，生成坐标集合；连接所述坐标集合中同一行中第a个重心坐标和第a+1个重心坐标而得到行连通域，其中所述a为自然数；根据所述行连通域获得所述行连通域的轮廓曲线；根据所述轮廓曲线将所述纠偏后的原始文字图像中对应的像素映射至空白图像中而得到行切后的原始文字图像。可选地，根据所述行连通域获得所述行连通域的轮廓曲线的步骤包括：确定所述纠偏后的原始文字图像的背景区域像素值为0，所述行连通域的像素值为1；依次遍历所述纠偏后的原始文字图像的像素点，获得所述二值图像的第k个像素点x,y；当所述第k个像素点x,y的像素值为1，且所述第k个像素点x,y的左邻域x-1,y、右邻域x+1,y的像素值分别为0、1时，在所述纠偏后的原始文字图像中标记与所述第k个像素点x,y坐标对应的像素点；当所述第k个像素点x,y的像素值为1，且所述第k个像素点x,y的上邻域x,y-1、左邻域x-1,y的像素值分别为0、1，或者所述第k个像素点x,y的上邻域x,y-1、右邻域x+1,y像素灰度值分别为0、1，或者所述第k个像素点x,y的上邻域x,y-1灰度值为1时，在所述纠偏后的原始文字图像中标记与所述第k个像素点x,y坐标对应的像素点；当所述第k个像素点x,y的像素值为1，且所述第k个像素点x,y的右邻域x+1,y、左邻域x-1,y的像素值分别为0、1时，在所述纠偏后的原始文字图像中标记与所述第k个像素点x,y坐标对应的像素点；当所述第k个像素点x,y的像素值为1，且所述第k个像素点x,y的下邻域x,y+1、上邻域x,y-1像素值分别为0、1，或者所述第k个像素点x,y的左邻域x-1,y像素灰度值为1，或者所述第k个像素点x,y的右邻域x+1,y像素灰度值为1时，在所述纠偏后的原始文字图像中标记与所述第k个像素点x,y坐标对应的像素点；连接所有被标记的像素点获得所述行连通域在所述纠偏后的原始文字图像中的轮廓曲线。可选地，所述对所述行切后的原始文字图像进行单字切割的步骤是通过利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。例如，在本实施例中，采用投影法来切割单字，利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。可选地，当判断所述行文字识别结果与所述行中所有的单字识别结果不同时，将所述行切后的原始文字图像及所述切割得到的每个单字图像通过所述OCR系统进行再次识别。本发明提供的文字图像标注方法通过OCR系统识别行文字图像及单字图像并将识别结果进行对比，如果对比结果相同则根据行文字识别结果对行文字图像进行标注，根据单字识别结果对所述单字图像进行标注，从而提高了标注的准确性。本发明还提供一种文字图像标注装置。参照图2所示，为本发明一实施例提供的文字图像标注装置的内部结构示意图。在本实施例中，文字图像标注装置可以是电脑或服务器，或其他有数据处理能力的电子装置。所述文字图像标注装置至少包括存储器11、处理器13，通信总线15，以及网络接口17。其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器例如，SD或DX存储器等、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是文字图像标注装置的内部存储单元，例如所述文字图像标注装置的硬盘。存储器11在另一些实施例中也可以是文字图像标注装置的外部存储设备，例如文字图像标注装置上配备的插接式硬盘，智能存储卡SmartMediaCard,SMC，安全数字SecureDigital,SD卡，闪存卡FlashCard等。进一步地，存储器11还可以既包括文字图像标注装置的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于文字图像标注装置的应用软件及各类数据，例如图片自动分类程序111的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。处理器13在一些实施例中可以是一中央处理器CentralProcessingUnit,CPU、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据。通信总线15用于实现这些组件之间的连接通信。网络接口17可选的可以包括标准的有线接口、无线接口如WI-FI接口，通常用于在文字图像标注装置与其他电子设备之间建立通信连接。可选地，文字图像标注装置还可以包括用户接口，用户接口可以包括显示器Display、输入单元比如键盘Keyboard，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLEDOrganicLight-EmittingDiode，有机发光二极管触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在文字图像标注装置中处理的信息以及用于显示可视化的用户界面。图2仅示出了具有组件11～17的文字图像标注装置，本领域技术人员可以理解的是，图2示出的结构并不构成对文字图像标注装置的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。在图2所示的文字图像标注装置的实施例中，存储器11中存储有文字图像标注程序；处理器13执行存储器11中存储的文字图像标注装置时实现如下步骤：对接收的原始文字图像进行纠偏；对纠偏后的原始文字图像进行行切；通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；具体地，文字识别过程为：OCR系统利用识别算法分析文字形态特征，判断出汉字的标准编码；对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注。可选地，所述对接收的原始文字图像进行纠偏的步骤包括：根据用户在所述原始文字图像的同一边缘处选取的至少两个校准点获取所述校准点的坐标；根据所述坐标计算所述原始文字图像的倾斜角的角度；根据所述倾斜角的角度对所述原始文字图像执行旋转校正。例如，在所述原始文字图像的水平边缘选取两个校准点，并获取所述校准点的坐标；根据所述坐标计算所述原始文字图像的倾斜角的角度，根据所述倾斜角的角度将所述原始文字图像旋转校正至水平位置。可选地，所述对纠偏后的原始文字图像进行行切的步骤包括：获取所述纠偏后的原始文字图像中文字区域的每个连通域的重心坐标，生成坐标集合；连接所述坐标集合中同一行中第a个重心坐标和第a+1个重心坐标而得到行连通域，其中所述a为自然数；根据所述行连通域获得所述行连通域的轮廓曲线；根据所述轮廓曲线将所述纠偏后的原始文字图像中对应的像素映射至空白图像中而得到行切后的原始文字图像。可选地，根据所述行连通域获得所述行连通域的轮廓曲线的步骤包括：确定所述纠偏后的原始文字图像的背景区域像素值为0，所述行连通域的像素值为1；依次遍历所述纠偏后的原始文字图像的像素点，获得所述二值图像的第k个像素点x,y；当所述第k个像素点x,y的像素值为1，且所述第k个像素点x,y的左邻域x-1,y、右邻域x+1,y的像素值分别为0、1时，在所述纠偏后的原始文字图像中标记与所述第k个像素点x,y坐标对应的像素点；当所述第k个像素点x,y的像素值为1，且所述第k个像素点x,y的上邻域x,y-1、左邻域x-1,y的像素值分别为0、1，或者所述第k个像素点x,y的上邻域x,y-1、右邻域x+1,y像素灰度值分别为0、1，或者所述第k个像素点x,y的上邻域x,y-1灰度值为1时，在所述纠偏后的原始文字图像中标记与所述第k个像素点x,y坐标对应的像素点；当所述第k个像素点x,y的像素值为1，且所述第k个像素点x,y的右邻域x+1,y、左邻域x-1,y的像素值分别为0、1时，在所述纠偏后的原始文字图像中标记与所述第k个像素点x,y坐标对应的像素点；当所述第k个像素点x,y的像素值为1，且所述第k个像素点x,y的下邻域x,y+1、上邻域x,y-1像素值分别为0、1，或者所述第k个像素点x,y的左邻域x-1,y像素灰度值为1，或者所述第k个像素点x,y的右邻域x+1,y像素灰度值为1时，在所述纠偏后的原始文字图像中标记与所述第k个像素点x,y坐标对应的像素点；连接所有被标记的像素点获得所述行连通域在所述纠偏后的原始文字图像中的轮廓曲线。可选地，所述对所述行切后的原始文字图像进行单字切割的步骤是通过利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。例如，在本实施例中，采用投影法来切割单字，利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。可选地，当判断所述行文字识别结果与所述行中所有的单字识别结果不同时，将所述行切后的原始文字图像及所述切割得到的每个单字图像通过所述OCR系统进行再次识别。本发明提供的文字图像标注装置通过OCR系统识别行文字图像及单字图像并将识别结果进行对比，如果对比结果相同则根据行文字识别结果对行文字图像进行标注，根据单字识别结果对所述单字图像进行标注，从而提高了标注的准确性。此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有的文字图像标注程序，所述文字图像标注程序可被一个或多个处理器执行，以实现如下操作：对接收的原始文字图像进行纠偏；对纠偏后的原始文字图像进行行切；通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；具体地，文字识别过程为：OCR系统利用识别算法分析文字形态特征，判断出汉字的标准编码；对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注。本发明计算机可读存储介质具体实施方式与上述装置和方法各实施例基本相同，在此不作累述。可选地，在其他实施例中，文字图像标注程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器本实施例为处理器13所执行以完成本发明，本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述文字图像标注程序在文字图像标注装置中的执行过程。例如，参照图3所示，为本发明图文字图像标注装置一实施例中的文字图像标注程序的程序模块示意图，该实施例中，文字图像标注程序可以被分割为纠偏模块20、行切模块30、第一识别模块40、切割模块50、第二识别模块60、及对比模块70，示例性地：所述纠偏模块20用于：对接收的原始文字图像进行纠偏；所述行切模块30用于：对纠偏后的原始文字图像进行行切；所述第一识别模块40用于：通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；具体地，文字识别过程为：OCR系统利用识别算法分析文字形态特征，判断出汉字的标准编码；所述切割模块50用于：对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；所述第二识别模块60用于：通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；所述对比模块70用于：将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注。上述纠偏模块20、行切模块30、第一识别模块40、切割模块50、第二识别模块60、及对比模块70等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质如ROMRAM、磁碟、光盘中，包括若干指令用以使得一台终端设备可以是手机，计算机，服务器，或者网络设备等执行本发明各个实施例所述的方法。以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

权利要求：1.一种文字图像标注方法，应用于文字图像标注装置中，其特征在于，所述文字图像标注方法包括：对接收的原始文字图像进行纠偏；对纠偏后的原始文字图像进行行切；通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注。2.如权利要求1所述的文字图像标注方法，其特征在于，所述对接收的原始文字图像进行纠偏的步骤包括：根据用户在所述原始文字图像的同一边缘处选取的至少两个校准点获取所述校准点的坐标；根据所述坐标计算所述原始文字图像的倾斜角的角度；根据所述倾斜角的角度对所述原始文字图像执行旋转校正。3.如权利要求1或2所述的文字图像标注方法，其特征在于，所述对纠偏后的原始文字图像进行行切的步骤包括：获取所述纠偏后的原始文字图像中文字区域的每个连通域的重心坐标，生成坐标集合；连接所述坐标集合中同一行中第a个重心坐标和第a+1个重心坐标而得到行连通域，其中所述a为自然数；根据所述行连通域获得所述行连通域的轮廓曲线；根据所述轮廓曲线将所述纠偏后的原始文字图像中对应的像素映射至空白图像中得到行切后的原始文字图像。4.如权利要求1或2所述的文字图像标注方法，其特征在于，所述对所述行切后的原始文字图像进行单字切割的步骤是通过利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。5.如权利要求1或2所述的文字图像标注方法，其特征在于，当判断所述行文字识别结果与所述行中所有的单字识别结果不同时，将所述行切后的原始文字图像及所述切割得到的每个单字图像通过所述OCR系统进行再次识别。6.一种文字图像标注装置，其特征在于，所述文字图像标注装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的文字图像标注程序，所述文字图像标注程序被所述处理器执行时实现如下步骤：对接收的原始文字图像进行纠偏；对纠偏后的原始文字图像进行行切；通过OCR系统对行切后的原始文字图像进行行文字识别，并保存行文字识别结果；对所述行切后的原始文字图像进行单字切割，并记录切割得到的每个单字图像在行中的先后顺序；通过所述OCR系统对切割得到的每个单字图像进行单字识别，并保存单字识别结果；将所述行文字识别结果与行中所有文字的单字识别结果进行对比，当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时，根据所述行文字识别结果对对应的行切后的原始文字图像进行标注，根据所述单字识别结果对对应的单字图像进行标注。7.如权利要求6所述的文字图像标注装置，其特征在于，所述对接收的原始文字图像进行纠偏的步骤包括：根据用户在所述原始文字图像的同一边缘处选取的至少两个校准点获取所述校准点的坐标；根据所述坐标计算所述原始文字图像的倾斜角的角度；根据所述倾斜角的角度对所述原始文字图像执行旋转校正。8.如权利要求6或7述的文字图像标注装置，其特征在于，所述对纠偏后的原始文字图像进行行切的步骤包括：获取所述纠偏后的原始文字图像中文字区域的每个连通域的重心坐标，生成坐标集合；连接所述坐标集合中同一行中第a个重心坐标和第a+1个重心坐标而得到行连通域，其中所述a为自然数；根据所述行连通域获得所述行连通域的轮廓曲线；根据所述轮廓曲线将所述纠偏后的原始文字图像中对应的像素映射至空白图像中而得到行切后的原始文字图像。9.如权利要求6或7所述的文字图像标注装置，其特征在于，所述对所述行切后的原始文字图像进行单字切割的步骤是通过利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有文字图像标注程序，所述文字图像标注程序可被一个或者多个处理器执行，以实现如权利要求1至5中任一项所述的文字图像标注方法的步骤。

百度查询：平安科技(深圳)有限公司文字图像标注方法、装置及计算机可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种NB模组驱动的摄像采集装置

下一篇：一种隐框式岩板蜂窝复合板

相关技术

一种NB模组驱动的摄像采集装置

一种隐框式岩板蜂窝复合板

一种机罩

一种用于塑料制品生产的表面加工装置

一种预应力钢绞线辅助穿束防缠绕工具

一种砂浆压实装置

一种房建施工用安全防坠装置

一种优化音频输出噪声的设备

一种新型预制电力排管

一种宽度紧凑型半导体封装结构

一种新型全遮光窗帘面料

一种纸尿裤生产用包边机

装置相关技术

发光装置和开关装置_法雷奥日本株式会社_202311810509.8

检漏装置及电源装置_华霆(合肥)动力技术有限公司_201810609560.5

振动装置和包括该振动装置的电子装置_乐金显示有限公司_202310325948.3

发送装置、接收装置以及基站_三菱电机株式会社_202080103380.5

分散装置以及堆积装置_精工爱普生株式会社_202311810325.1

手柄、输送装置及消融装置_深圳市先健呼吸科技有限公司_202211685727.9

节流装置和冷藏冷冻装置_青岛海尔电冰箱有限公司_202211677886.4

上下料装置和运输装置_拉普拉斯新能源科技股份有限公司_202410248213.X

SCR脱硝装置的导流装置_哈尔滨锅炉厂有限责任公司_201811073270.X

经由胆道进入装置的装置输送_波士顿科学国际有限公司_202280072490.9

计算机相关技术

目标检测方法、装置、计算机设备及计算机可读存储介质_顺丰科技有限公司_202211702519.5

设备控制方法、装置、计算机设备及计算机可读存储介质_深圳TCL新技术有限公司_202211715506.1

直播交互方法、装置、计算机设备及计算机可读存储介质_书行科技(北京)有限公司_202410329242.9

快件分拣方法、装置、计算机设备及计算机可读存储介质_顺丰科技有限公司_202211701100.8

一种计算机实现的方法、装置和计算机程序产品_京东方科技集团股份有限公司_202310789914.X

人脸识别方法及装置、计算机设备、计算机存储介质_平安科技(深圳)有限公司_201811554534.3

游戏交互方法、装置、计算机设备及计算机可读存储介质_网易(杭州)网络有限公司_202410487483.6

计算机防护装置_路中美_202322602241.0

透视计算机显示系统_曼托第一收购有限责任公司_202010208102.8

资源对象推荐方法、装置、计算机设备、存储介质和计算机程序产品_中国工商银行股份有限公司_202410504598.1

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

片间通信方法_中科寒武纪科技股份有限公司_202211681198.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

文字图像标注方法、装置及计算机可读存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务