一种碑帖图像中的文字切割方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：天津大学

摘要：本发明公开一种基于图像形态学的碑帖文字切割方法，包括如下步骤：步骤1，选取碑帖文字图像进行矫正生成预处理图像；步骤2，对预处理图像进行文字切割生成文字图像；步骤3，对文字图像进行降噪处理；该方法切割后的文字做降噪处理，使得生成的文字更加清晰。

主权项：1.一种碑帖图像中的文字切割方法，其特征在于，包括如下步骤：步骤1，选取碑帖文字图像进行矫正生成预处理图像；步骤2，对预处理图像进行文字切割生成文字图像；步骤3，对文字图像进行降噪处理；其中，所述步骤2中对预处理图像进行文字切割生成文字图像步骤包括：2.1，对预处理图像进行增强、灰度化处理生成灰度图像；2.2，对灰度图像进行二值化处理后转成黑白图像；2.3，对黑白图像进行第一次列投影，估算图像文字列数，将图像宽度更改为“列固定宽度”*“估计的列数”，其中“列固定宽度”为一个定值，即每个文字最终切割后生成的图像宽度，由用户根据实际使用需求进行设定；2.4，经过第一次列投影处理完成了图像宽度变更后的黑白图像作为第二次列投影处理的输入图像；2.5，对调整后的黑白图像进行第二次列投影处理获取列投影切割坐标；2.6，根据列投影切割坐标，在文字图像进行切割生成文字图像。

全文数据：一种碑帖图像中的文字切割方法技术领域本方法涉及一种图像文字切割方法，尤其是碑帖文字切割方法。背景技术数学形态学Mathematicalmorphology是一门建立在格论和拓扑学基础之上的图像分析学科，是数学形态学图像处理的基本理论。其基本的运算包括：腐蚀和膨胀、开运算和闭运算、骨架抽取、极限腐蚀、击中击不中变换、形态学梯度、Top-hat变换、颗粒分析、流域变换等。膨胀Dilation的定义为“位于某个点的探针结构元素是否有探测到物件？”一个影像A经过结构元素B膨胀后的结果可写为：其中Bx＝{x+b|b∈B，代表结构元素平移x后的点集合，b是图像B的元素的坐标。另外也可写为同上，其中A-b是指二值影像A经过平移-b后新的点集合。腐蚀Erosion的定义为“位于某个点的探针结构元素是否全都有探测到物件？”一个影像A经过结构元素B腐蚀后的结果可写为：开运算Opening与闭运算Closing是使用相同结构函数的腐蚀与膨胀的组合：开运算为先腐蚀再膨胀，闭运算为先膨胀再腐蚀，仿射变换是一种二维坐标到二维坐标之间的线性变换，它保持了二维图形的“平直性”直线经过变换之后依然是直线和“平行性”二维图形之间的相对位置关系保持不变，平行线依然是平行线，且直线上点的位置顺序不变。任意的仿射变换都能表示为乘以一个矩阵线性变换，再加上一个向量平移的形式。x′＝m11x+m12y+m13y′＝m21x+m22y+m23以上公式将点x，y映射到x′，y′，在OpenCV中通过指定一个2x3矩阵实现此功能公式中的m矩阵，是线性变换和平移的组合，m11，m12，m21，m22为线性变化参数，m13，m23为平移参数，其最后一行固定为0，0，1，因此，将3x3矩阵简化为2x3。透视变换是将图片投影到一个新的视平面，也称作投影映射.它是二维x，y到三维X，Y，Z，再到另一个二维x′，y′空间的映射。相对于仿射变换，它提供了更大的灵活性，将一个四边形区域映射到另一个四边形区域不一定是平行四边形。它不止是线性变换，但也是通过矩阵乘法实现的，使用的是一个3x3的矩阵，矩阵的前两行与仿射矩阵相同m11，m12，m13，m21，m22，m23，也实现了线性变换和平移，第三行用于实现透视变换。X＝m11x+m12y+m13zY＝m21x+m22y+M23zZ＝m31x+m32y+m33z以上公式设变换之前的点是z值为1的点，它三维平面上的值是x、y、1，在二维平面上的投影是x、y，通过矩阵变换成三维中的点X、Y、Z，再通过除以三维中Z轴的值，转换成二维中的点x′，y′。从以上公式可知，仿射变换是透视变换的一种特殊情况。它把二维转到三维，变换后，再映射回之前的二维空间。图像分割技术是数字图像处理中的重点部分，一直受到研究人员的高度重视，迄今为止已有上百种不同的分割算法，但是这些算法均是针对具体问题而产生的，并没有一种普遍适用的算法可以解决所有的问题。发明内容针对上述现有技术存在的问题，本发明提供一种基于图像形态学的碑帖文字切割方法，本方法具有普适性；同时，本方法对切割后的文字做降噪处理，使得生成的文字更加清晰。为了解决现有技术问题，本方案采用如下技术方案：一种基于图像形态学的碑帖文字切割方法，包括如下步骤：步骤1，选取碑帖文字图像进行矫正生成预处理图像；步骤2，对预处理图像进行文字切割生成文字图像；步骤3，对文字图像进行降噪处理；其中，所述步骤2中对预处理图像进行文字切割生成文字图像步骤包括：2.1，对预处理图像进行增强、灰度化处理生成灰度图像；2.2，对灰度图像进行二值化处理后转成黑白图像；2.3，对黑白图像进行第一次列投影，估算图像文字列数，更改图像宽度为“列固定宽度”*“估计的列数”；2.3，对黑白图像进行第一次列投影处理获得该图列宽度；2.4，对调整后的黑白图像进行第二次列投影处理获取列投影切割坐标；2.5，根据列投影切割坐标，在文字图像进行切割生成文字图像。所述步骤1中对选取碑帖文字图像进行矫正生成预处理图像步骤包括：1.1，对选取碑帖文字图像进行增强、灰度化处理生成灰度图像；1.2，对灰度图像进行二值化处理后转成黑白图像；1.3，对黑白图像1.3，对黑白图像进行仿射算法生成预处理图像。所述步骤3对文字图像进行降噪处理步骤包括：3.1,对预处理图像进行增强、灰度化处理生成灰度图像；3.2，对灰度图像进行二值化处理后转成黑白图像；3.3，对黑白图像进行小噪点和文字边框噪点处理生成第一除噪图像；3.4，对第一除噪图像进行边框和外围噪点处理生成第二除噪图像；其中，所述第一除噪图像采用如下步骤：3.31，将图像转换为黑底白字的w*h大小，统一大小方便腐蚀和膨胀；3.32，开运算来清除小噪点；3.33，对操作后的图像做均值滤波处理，其中，所述第二除噪图像采用如下步骤：3.41，对边框噪点进行掩膜运算；3.42，对外围噪点进行横向和纵向投影清理。与现有技术相比，本发明的有益效果是：1、本方法增强了不同形态碑帖图像的切割准确率。2、本方法与现有技术相比，能够实现对图片大小、字数、形态不同的图像文字进行正确切割。附图说明图1本发明一种基于图像形态学的碑帖文字切割方法中矫正步骤流程图。图2本发明一种基于图像形态学的碑帖文字切割方法中列切割步骤流程图。图3本发明一种基于图像形态学的碑帖文字切割方法中降噪步骤流程图。图4本发明一种基于图像形态学的碑帖文字切割方法中判别算法流程图。图5本发明一种基于图像形态学的碑帖文字切割方法中仿射图。图6本发明一种基于图像形态学的碑帖文字切割方法中仿射算法流程图。图7本发明一种基于图像形态学的碑帖文字切割方法中投影获取顶点。图8本发明一种基于图像形态学的碑帖文字切割方法中改进二值化算法。图9本发明一种基于图像形态学的碑帖文字切割方法中切割点选取示意图。图10本发明一种基于图像形态学的碑帖文字切割方法中校验算法。具体实施方式下面结合附图和具体实施算例对本发明技术方案作进一步详细描述。1、图像矫正将原始图像做增强亮度、色度、对比度、锐度处理，以增加文字主体轮廓，然后对图像做灰度化和二值化操作，使之变成二值图像，把二值化的图像通过判别算法判别图像为黑底白字或白底黑字，然后统一转化为白底黑字图像，以便识别出整个轮廓。算法描述如图4所示。对白底黑字的图像org_w，org_h调整为适当的像素w，h大小，然后再做腐蚀、膨胀操作，使白色底色基本掩盖住黑色文字，以显示整个图像文字区域的主体，对处理后的图像做主体区域识别，获取主体区域的四个顶点作为基准坐标点，记为x1，y1、x2，y2、x3，y3、x4，y4，再对四个基准坐标点扩充，扩充后的区域为矩形区域，也就是纠正后图像的位置区域，扩充方法为：x′1＝minx1，x2，x3，x4y′1＝miny1，y2，y3，y4x′2＝maxx1，x2，x3，x4y′2＝miny1，y2，y3，y4x′3＝minx1，x2，x3，x4y′3＝maxy1，y2，y3，y4x′4＝maxx1，x2，x3，x4y′4＝maxy1，y2，y3，y4得到新的四个扩充坐标，再将x1，y1、x2，y2、x3，y3、x4，y4和x′1，y′1、x′2，y′2、x′3，y′3、x′4，y′4转化到原图像对应的坐标org_x1，org_y1、org_x2，org_y2、org_x3，org_y3、org_x4，org_y4和org_x′1，org_y′1、org_x′2，org_y′2、org_x′3，org_y′3、org_x′4，org_y′4，在原图上取三个点得到两个点集pts＝[org_x1，org_y1，org_x2，org_y2，org_x3，org_y3]和pts′＝[org_x′1，org_y′1，org_x′2，org_y′2，org_x′3，org_y′3]，根据pts和pts′计算出仿射变换矩阵M，然后利用仿射变换，将原图像的org_x1，org_y1、org_x2，org_y2、org_x3，org_y3、org_x4，org_y4区域仿射到原图像org_x′1，org_y′1、org_x′2，org_y′2、org_x′3，org_y′3、org_x′4，org_y′4区域内，即可使得倾斜图像得到矫正。其中，org_x1＝x1*ratio_w，ratio_w＝org_ww，org_w为原图宽，w为缩放后的高；org_y1＝y1*ratio_h，ratio_h＝org_hh，org_h为原图高，h为缩放后的高；其他坐标同理。矩阵org_x′，org_y′为把原图ori_x，ori_y通过M进行仿射。对于矫正后的图像，仍存在一定宽度的边框，再沿原图像四个新的扩充区域的顶点坐标org_x′1，org_y′1、org_x′2，org_y′2、org_x′3，org_y′3、org_x′4，org_y′4将原图像进行切割，最终不带边框的矫正图像，如图8、9所示。以上算法只是对通常情况下不存在拍摄角度倾斜的碑帖图像，这类图像不存在三维倾斜，仅在二维平面上进行缩放、平移、旋转、剪裁等，对于其他采用数码相机等拍摄的碑帖文字图像，由于拍摄角度很难保证垂直于碑帖，得到的图像主体区域并非矩形或平行四边形，采用上述方法得到的图像仍然有角度倾斜。针对这类图像，首先对二值化图像进行投影来获取四个顶点坐标x1，y1、x2，y2、x3，y3、x4，y4，如图10所示。再通过上述顶点扩充方式，取得新的扩充区域x′1，y′1、x′2，y′2、x′3，y′3、x′4，y′4，再将两个区域还原到原图像中，在原图像新的扩充区域内，对原顶点坐标做透视变换，透视区域为新的扩充区域，图像得到角度矫正。对矫正后的图像采取上述矫正方法，最终图像得到矫正。2、文字切割矫正图像是在原图像上进行的，所以矫正后的图像仍是原图像的矫正结果，而不是二值化图像的矫正结果。对图像进行列切割时，仍然需要先对图像做增强、灰度化和二值化处理，灰度化处理直接执行即可，二值化图像处理中，由于存在大量噪点等问题，采用阈值二值化或自适应二值化得到的二值图像均存在大量噪点，这里采用的方式是根据像素平均值进行的改进二值化算法，算法描述如图5所示：通过进行上述二值化算法操作，得到的二值化图像含有的噪点较少。然后将二值化图像转换为黑底白字图像，并进行腐蚀膨胀处理，膨胀半径要大于腐蚀半径，将膨胀的图像进行列投影，在投影图像中记录第一行的第一个像素点0，最后一个像素点w-1和第一行中像素变化的像素点如：前一个为黑色，当前为白色，则记录，这些像素点代表每一列文字投影的最大范围，直接按照这些像素点切割，导致部分文字笔画被切割掉，同时会把黑色背景进行切割，导致切割的文字残缺并掺杂黑色背景，因此将这些像素点进行遍历筛查，得到两列文字投影的中间坐标，筛查算法为：若第一个位白色，则从第二个开始，每隔两个计算当前像素点与下一个像素点的平局值保存到新的数组中；若第一个为黑色，则从第三个开始，每个两个计算当前像素点与下一个像素点的平均值保存到新的数组中，如图9所示。这样新的数组存储的便是两列文字投影的中间坐标，然后计算整个碑帖图像的列数col_num等于数组长度L减1，公式表示为col_num＝L-1。得到碑帖图像的列数后，就可以设定每一列的宽度为固定值every_col，然后计算需要将这个碑帖图像缩放的总宽度W＝every_col*col_num，再根据这个宽度对二值化图像变形，最后进行二次列投影。在二次列投影中二次列投影为真实列投影，设定腐蚀核为col_num,col_num，设定膨胀核为2*col_num,2*col_num，膨胀核要比腐蚀核大，需要将文字笔画间隙填充，以便投影区域间隙少。然后进行二次列投影，采用上述同样方法，记录相应坐标，把坐标变换到原图中对应的坐标，然后在原图上进行切割，碑帖图像就会被切割成多列。对列切割得到的图像进行行切割，采用的方法与列切割类似，行数估计方法也相同，在进行行切割过程中，由于对每一列文字进行切割，会导致例如“二”这类文字容易造成行预估不准确，直接影响后续二次切割，所以需要添加校验算法来判断这类结构的文字。算法描述如图10所示。每张图片大小和文字的行数、列数不同，对图像进行膨胀腐蚀操作时，无法针对不同的图像调整膨胀和腐蚀核的尺寸。所以，固定每一列的宽度，针对每一列的宽度调整合适的膨胀和腐蚀核的尺寸，这样不论图像大小和文字列数如何变化，都遵循这个核的大小，可以避免过度膨胀和过度腐蚀，达到了自适应的目的1通过校验算法，可以减少部分上下结构文字对文字预估的影响，在二次行切割过程中，仍需要进行校验，目的在于保证上下结构的文字被正确切割。最后切割操作需要在列切割后的图像上进行。3、图像降噪列切割和行切割均在原图进行切割，所以需要降噪的图像也是原图切割下来的每个文字图像。首先将图像进行增强处理，再做滤波处理和灰度化处理，这样得到的图像噪点平滑，然后根据平均像素值做二值化处理，二值化处理得到的图像大部分噪点也被清除，原因是做增强后灰度图的轮廓更加清晰噪点也更加平滑，所以经过平均像素的二值化处理后可以清理这部分噪点。得到的二值化图像仍存在小噪点和文字边框噪点，首先清除小噪点，采取的方式如下：将图像转换为黑底白字的w*h大小，统一大小以便于进行腐蚀和膨胀操作；开运算来清除小噪点；对操作后的图像做均值滤波处理，这样得到的图像就主要存在边框噪点和外围噪点。在清理边框噪点过程中分为两步，第一步采取掩膜运算，第二步采用横向和纵向投影清理。清理边框噪点：首先进行腐蚀，目的在于清理边框区域白色像素，然后进行两次膨胀处理，第一次为恢复文字笔画主体，第二次为大范围填充白色笔画区域，以便识别整理轮廓；采用ROI识别算法识别出整体区域，建立纯黑色背景，将ROI区域变换到腐蚀和膨胀前的图像中，再将这部分区域移植到纯黑色背景，这样，边框噪点就得以清除。清理外围噪点：在清理边框噪点的基础上，外围噪点主要存在于文字边缘。清理外围噪点仍然采用投影方式，为了调整卷积核到合适的大小，这里仍采用图像缩放的方式，首先将图像缩放到w,h，然后进行腐蚀操作，目的在于完全清理文字外围噪点；腐蚀后的图像文字笔画也会被腐蚀掉，直接投影导致投影区域过小，因此还需进行膨胀操作，以填充笔画间隙和还原文字主体轮廓区域。对膨胀后的图像进行横向和纵向投影，分别获取白色像素点分布的最小和最大坐标，共4个点。将横向和纵向投影的点两两组合，这样就得到要切割的四个坐标点，然后将四个坐标点返回至缩放后的图像中，进行切割，完成外围噪点清理。

权利要求：1.一种基于图像形态学的碑帖文字切割方法，其特征在于，包括如下步骤：步骤1，选取碑帖文字图像进行矫正生成预处理图像；步骤2，对预处理图像进行文字切割生成文字图像；步骤3，对文字图像进行降噪处理；其中，所述步骤2中对预处理图像进行文字切割生成文字图像步骤包括：2.1，对预处理图像进行增强、灰度化处理生成灰度图像；2.2，对灰度图像进行二值化处理后转成黑白图像；2.3，对黑白图像进行第一次列投影，估算图像文字列数，更改图像宽度为“列固定宽度”*“估计的列数”；2.4，对黑白图像进行第一次列投影处理获得该图列宽度；2.5，对调整后的黑白图像进行第二次列投影处理获取列投影切割坐标；2.6，根据列投影切割坐标，在文字图像进行切割生成文字图像。2.根据权利要求1所述的一种基于图像形态学的碑帖文字切割方法，其特征在于，所述步骤1中对选取碑帖文字图像进行矫正生成预处理图像步骤包括：1.1，对选取碑帖文字图像进行增强、灰度化处理生成灰度图像；1.2，对灰度图像进行二值化处理后转成黑白图像；1.3，对黑白图像1.4，对黑白图像进行仿射算法生成预处理图像。3.根据权利要求1所述的一种基于图像形态学的碑帖文字切割方法，其特征在于，所述步骤3对文字图像进行降噪处理步骤包括：3.1,对预处理图像进行增强、灰度化处理生成灰度图像；3.2，对灰度图像进行二值化处理后转成黑白图像；3.3，对黑白图像进行小噪点和文字边框噪点处理生成第一除噪图像；3.4，对第一除噪图像进行边框和外围噪点处理生成第二除噪图像；其中，所述第一除噪图像采用如下步骤：3.31，将图像转换为黑底白字的w*h大小，统一大小方便腐蚀和膨胀；3.32，开运算来清除小噪点；3.33，对操作后的图像做均值滤波处理，其中，所述第二除噪图像采用如下步骤：3.41，对边框噪点进行掩膜运算；3.42，对外围噪点进行横向和纵向投影清理。

百度查询：天津大学一种碑帖图像中的文字切割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于非周期非均匀缝隙电容加载的环型宽带水平极化全向天线

下一篇：一种带有短路检测的连接器插针机

相关技术

一种基于非周期非均匀缝隙电容加载的环型宽带水平极化全向天线

一种带有短路检测的连接器插针机

一种磷酸铈钴锂改性类单晶富锂锰基正极材料的制备方法及其产物

一种线控转向系统动态负载模拟装置及控制方法

一种恒压输出调光电路

超临界晶圆清洗/干燥介质回收方法以及系统

一种飞机复合材料部件超规范修理专家系统

一种分层架构下的无人机网络动态任务卸载方法

镭雕装置

性别判定模型的生成方法、装置、电子设备及介质

独立站数据定向同步方法及其装置、设备、介质

一种适用于现货市场的电网结构仿真方法

切割相关技术

一种可定位切割的水果切割装置_河北诚业智能科技股份有限公司_202420759382.5

一种引脚切割设备及其切割方法_东莞市大成智能装备有限公司_202410852171.0

切割机_株式会社牧田_202410280340.8

切割球囊_昆山金泰医疗科技有限公司_202323569941.0

等离子切割喷嘴_常州市武进高新区智鑫焊割机械有限公司_202411000756.6

一种铝材切割用防刮蹭刀的铝材切割机及切割方法_济南赛斯智能装备有限公司_202410293314.9

一种切割装置_四川陈吉旺福食品有限公司_202420339901.2

一种切割设备_陈谦_202322723431.8

金属切板切割装置_苏州苏自通德自动化有限公司_202410837944.8

角钢切割下料装置_邯郸市赛通电力器材制造有限公司_202420052460.8

文字相关技术

电子白板的文字绘制方法、系统、电子白板和存储介质_广州朗国电子科技股份有限公司_202210189443.4

基于术语库的多语言文字替换方法、系统、设备及介质_中译语通科技股份有限公司_202210724934.4

文字美化方法、装置、可读存储介质和电子设备_维沃移动通信有限公司_202110815639.5

通过AI分析图片、编辑文字发送朋友圈、微博的方法、介质及电子设备_张翔宇_202410302261.2

文字识别方法、装置、电子设备和存储介质_中化现代农业有限公司_202311562124.4

文字识别方法、装置及设备_深圳力维智联技术有限公司_202110788604.7

一种文字显示方法及相关装置_长城汽车股份有限公司_202410830100.0

文字类扫描半色调图像恢复方法_西安理工大学_202410800962.9

文字输入方法、装置、电子设备及存储介质_百度国际科技(深圳)有限公司_202410709798.0

一种票据微缩文字检测方法、系统及介质_长城信息股份有限公司_202410447119.7

图像相关技术

图像处理装置和图像处理方法_索尼集团公司_202080060686.7

图像处理方法和图像处理装置_华为技术有限公司_202280090385.8

图像增强_坎瓦有限公司_202410305689.2

图像信号处理装置、内窥镜系统、图像信号处理方法以及图像信号处理程序_奥林巴斯株式会社_202280091395.3

图像解码装置、图像编码装置、图像处理系统和程序_KDDI株式会社_201980018417.1

图像编码/解码方法和图像数据的发送方法_LX半导体科技有限公司_202410980744.8

图像编码/解码方法和图像数据的发送方法_LX半导体科技有限公司_202410980751.8

图像采集系统的标定方法及图像采集系统_北京迁移科技有限公司_202410700422.3

图像传感器及图像传感器模块_株式会社东芝_202310937414.6

图像编码/解码方法和图像数据的发送方法_LX半导体科技有限公司_202410980748.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种碑帖图像中的文字切割方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务