首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种碑帖图像中的文字切割方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津大学

摘要:本发明公开一种基于图像形态学的碑帖文字切割方法,包括如下步骤:步骤1,选取碑帖文字图像进行矫正生成预处理图像;步骤2,对预处理图像进行文字切割生成文字图像;步骤3,对文字图像进行降噪处理;该方法切割后的文字做降噪处理,使得生成的文字更加清晰。

主权项:1.一种碑帖图像中的文字切割方法,其特征在于,包括如下步骤:步骤1,选取碑帖文字图像进行矫正生成预处理图像;步骤2,对预处理图像进行文字切割生成文字图像;步骤3,对文字图像进行降噪处理;其中,所述步骤2中对预处理图像进行文字切割生成文字图像步骤包括:2.1,对预处理图像进行增强、灰度化处理生成灰度图像;2.2,对灰度图像进行二值化处理后转成黑白图像;2.3,对黑白图像进行第一次列投影,估算图像文字列数,将图像宽度更改为“列固定宽度”*“估计的列数”,其中“列固定宽度”为一个定值,即每个文字最终切割后生成的图像宽度,由用户根据实际使用需求进行设定;2.4,经过第一次列投影处理完成了图像宽度变更后的黑白图像作为第二次列投影处理的输入图像;2.5,对调整后的黑白图像进行第二次列投影处理获取列投影切割坐标;2.6,根据列投影切割坐标,在文字图像进行切割生成文字图像。

全文数据:一种碑帖图像中的文字切割方法技术领域本方法涉及一种图像文字切割方法,尤其是碑帖文字切割方法。背景技术数学形态学Mathematicalmorphology是一门建立在格论和拓扑学基础之上的图像分析学科,是数学形态学图像处理的基本理论。其基本的运算包括:腐蚀和膨胀、开运算和闭运算、骨架抽取、极限腐蚀、击中击不中变换、形态学梯度、Top-hat变换、颗粒分析、流域变换等。膨胀Dilation的定义为“位于某个点的探针结构元素是否有探测到物件?”一个影像A经过结构元素B膨胀后的结果可写为:其中Bx={x+b|b∈B,代表结构元素平移x后的点集合,b是图像B的元素的坐标。另外也可写为同上,其中A-b是指二值影像A经过平移-b后新的点集合。腐蚀Erosion的定义为“位于某个点的探针结构元素是否全都有探测到物件?”一个影像A经过结构元素B腐蚀后的结果可写为:开运算Opening与闭运算Closing是使用相同结构函数的腐蚀与膨胀的组合:开运算为先腐蚀再膨胀,闭运算为先膨胀再腐蚀,仿射变换是一种二维坐标到二维坐标之间的线性变换,它保持了二维图形的“平直性”直线经过变换之后依然是直线和“平行性”二维图形之间的相对位置关系保持不变,平行线依然是平行线,且直线上点的位置顺序不变。任意的仿射变换都能表示为乘以一个矩阵线性变换,再加上一个向量平移的形式。x′=m11x+m12y+m13y′=m21x+m22y+m23以上公式将点x,y映射到x′,y′,在OpenCV中通过指定一个2x3矩阵实现此功能公式中的m矩阵,是线性变换和平移的组合,m11,m12,m21,m22为线性变化参数,m13,m23为平移参数,其最后一行固定为0,0,1,因此,将3x3矩阵简化为2x3。透视变换是将图片投影到一个新的视平面,也称作投影映射.它是二维x,y到三维X,Y,Z,再到另一个二维x′,y′空间的映射。相对于仿射变换,它提供了更大的灵活性,将一个四边形区域映射到另一个四边形区域不一定是平行四边形。它不止是线性变换,但也是通过矩阵乘法实现的,使用的是一个3x3的矩阵,矩阵的前两行与仿射矩阵相同m11,m12,m13,m21,m22,m23,也实现了线性变换和平移,第三行用于实现透视变换。X=m11x+m12y+m13zY=m21x+m22y+M23zZ=m31x+m32y+m33z以上公式设变换之前的点是z值为1的点,它三维平面上的值是x、y、1,在二维平面上的投影是x、y,通过矩阵变换成三维中的点X、Y、Z,再通过除以三维中Z轴的值,转换成二维中的点x′,y′。从以上公式可知,仿射变换是透视变换的一种特殊情况。它把二维转到三维,变换后,再映射回之前的二维空间。图像分割技术是数字图像处理中的重点部分,一直受到研究人员的高度重视,迄今为止已有上百种不同的分割算法,但是这些算法均是针对具体问题而产生的,并没有一种普遍适用的算法可以解决所有的问题。发明内容针对上述现有技术存在的问题,本发明提供一种基于图像形态学的碑帖文字切割方法,本方法具有普适性;同时,本方法对切割后的文字做降噪处理,使得生成的文字更加清晰。为了解决现有技术问题,本方案采用如下技术方案:一种基于图像形态学的碑帖文字切割方法,包括如下步骤:步骤1,选取碑帖文字图像进行矫正生成预处理图像;步骤2,对预处理图像进行文字切割生成文字图像;步骤3,对文字图像进行降噪处理;其中,所述步骤2中对预处理图像进行文字切割生成文字图像步骤包括:2.1,对预处理图像进行增强、灰度化处理生成灰度图像;2.2,对灰度图像进行二值化处理后转成黑白图像;2.3,对黑白图像进行第一次列投影,估算图像文字列数,更改图像宽度为“列固定宽度”*“估计的列数”;2.3,对黑白图像进行第一次列投影处理获得该图列宽度;2.4,对调整后的黑白图像进行第二次列投影处理获取列投影切割坐标;2.5,根据列投影切割坐标,在文字图像进行切割生成文字图像。所述步骤1中对选取碑帖文字图像进行矫正生成预处理图像步骤包括:1.1,对选取碑帖文字图像进行增强、灰度化处理生成灰度图像;1.2,对灰度图像进行二值化处理后转成黑白图像;1.3,对黑白图像1.3,对黑白图像进行仿射算法生成预处理图像。所述步骤3对文字图像进行降噪处理步骤包括:3.1,对预处理图像进行增强、灰度化处理生成灰度图像;3.2,对灰度图像进行二值化处理后转成黑白图像;3.3,对黑白图像进行小噪点和文字边框噪点处理生成第一除噪图像;3.4,对第一除噪图像进行边框和外围噪点处理生成第二除噪图像;其中,所述第一除噪图像采用如下步骤:3.31,将图像转换为黑底白字的w*h大小,统一大小方便腐蚀和膨胀;3.32,开运算来清除小噪点;3.33,对操作后的图像做均值滤波处理,其中,所述第二除噪图像采用如下步骤:3.41,对边框噪点进行掩膜运算;3.42,对外围噪点进行横向和纵向投影清理。与现有技术相比,本发明的有益效果是:1、本方法增强了不同形态碑帖图像的切割准确率。2、本方法与现有技术相比,能够实现对图片大小、字数、形态不同的图像文字进行正确切割。附图说明图1本发明一种基于图像形态学的碑帖文字切割方法中矫正步骤流程图。图2本发明一种基于图像形态学的碑帖文字切割方法中列切割步骤流程图。图3本发明一种基于图像形态学的碑帖文字切割方法中降噪步骤流程图。图4本发明一种基于图像形态学的碑帖文字切割方法中判别算法流程图。图5本发明一种基于图像形态学的碑帖文字切割方法中仿射图。图6本发明一种基于图像形态学的碑帖文字切割方法中仿射算法流程图。图7本发明一种基于图像形态学的碑帖文字切割方法中投影获取顶点。图8本发明一种基于图像形态学的碑帖文字切割方法中改进二值化算法。图9本发明一种基于图像形态学的碑帖文字切割方法中切割点选取示意图。图10本发明一种基于图像形态学的碑帖文字切割方法中校验算法。具体实施方式下面结合附图和具体实施算例对本发明技术方案作进一步详细描述。1、图像矫正将原始图像做增强亮度、色度、对比度、锐度处理,以增加文字主体轮廓,然后对图像做灰度化和二值化操作,使之变成二值图像,把二值化的图像通过判别算法判别图像为黑底白字或白底黑字,然后统一转化为白底黑字图像,以便识别出整个轮廓。算法描述如图4所示。对白底黑字的图像org_w,org_h调整为适当的像素w,h大小,然后再做腐蚀、膨胀操作,使白色底色基本掩盖住黑色文字,以显示整个图像文字区域的主体,对处理后的图像做主体区域识别,获取主体区域的四个顶点作为基准坐标点,记为x1,y1、x2,y2、x3,y3、x4,y4,再对四个基准坐标点扩充,扩充后的区域为矩形区域,也就是纠正后图像的位置区域,扩充方法为:x′1=minx1,x2,x3,x4y′1=miny1,y2,y3,y4x′2=maxx1,x2,x3,x4y′2=miny1,y2,y3,y4x′3=minx1,x2,x3,x4y′3=maxy1,y2,y3,y4x′4=maxx1,x2,x3,x4y′4=maxy1,y2,y3,y4得到新的四个扩充坐标,再将x1,y1、x2,y2、x3,y3、x4,y4和x′1,y′1、x′2,y′2、x′3,y′3、x′4,y′4转化到原图像对应的坐标org_x1,org_y1、org_x2,org_y2、org_x3,org_y3、org_x4,org_y4和org_x′1,org_y′1、org_x′2,org_y′2、org_x′3,org_y′3、org_x′4,org_y′4,在原图上取三个点得到两个点集pts=[org_x1,org_y1,org_x2,org_y2,org_x3,org_y3]和pts′=[org_x′1,org_y′1,org_x′2,org_y′2,org_x′3,org_y′3],根据pts和pts′计算出仿射变换矩阵M,然后利用仿射变换,将原图像的org_x1,org_y1、org_x2,org_y2、org_x3,org_y3、org_x4,org_y4区域仿射到原图像org_x′1,org_y′1、org_x′2,org_y′2、org_x′3,org_y′3、org_x′4,org_y′4区域内,即可使得倾斜图像得到矫正。其中,org_x1=x1*ratio_w,ratio_w=org_ww,org_w为原图宽,w为缩放后的高;org_y1=y1*ratio_h,ratio_h=org_hh,org_h为原图高,h为缩放后的高;其他坐标同理。矩阵org_x′,org_y′为把原图ori_x,ori_y通过M进行仿射。对于矫正后的图像,仍存在一定宽度的边框,再沿原图像四个新的扩充区域的顶点坐标org_x′1,org_y′1、org_x′2,org_y′2、org_x′3,org_y′3、org_x′4,org_y′4将原图像进行切割,最终不带边框的矫正图像,如图8、9所示。以上算法只是对通常情况下不存在拍摄角度倾斜的碑帖图像,这类图像不存在三维倾斜,仅在二维平面上进行缩放、平移、旋转、剪裁等,对于其他采用数码相机等拍摄的碑帖文字图像,由于拍摄角度很难保证垂直于碑帖,得到的图像主体区域并非矩形或平行四边形,采用上述方法得到的图像仍然有角度倾斜。针对这类图像,首先对二值化图像进行投影来获取四个顶点坐标x1,y1、x2,y2、x3,y3、x4,y4,如图10所示。再通过上述顶点扩充方式,取得新的扩充区域x′1,y′1、x′2,y′2、x′3,y′3、x′4,y′4,再将两个区域还原到原图像中,在原图像新的扩充区域内,对原顶点坐标做透视变换,透视区域为新的扩充区域,图像得到角度矫正。对矫正后的图像采取上述矫正方法,最终图像得到矫正。2、文字切割矫正图像是在原图像上进行的,所以矫正后的图像仍是原图像的矫正结果,而不是二值化图像的矫正结果。对图像进行列切割时,仍然需要先对图像做增强、灰度化和二值化处理,灰度化处理直接执行即可,二值化图像处理中,由于存在大量噪点等问题,采用阈值二值化或自适应二值化得到的二值图像均存在大量噪点,这里采用的方式是根据像素平均值进行的改进二值化算法,算法描述如图5所示:通过进行上述二值化算法操作,得到的二值化图像含有的噪点较少。然后将二值化图像转换为黑底白字图像,并进行腐蚀膨胀处理,膨胀半径要大于腐蚀半径,将膨胀的图像进行列投影,在投影图像中记录第一行的第一个像素点0,最后一个像素点w-1和第一行中像素变化的像素点如:前一个为黑色,当前为白色,则记录,这些像素点代表每一列文字投影的最大范围,直接按照这些像素点切割,导致部分文字笔画被切割掉,同时会把黑色背景进行切割,导致切割的文字残缺并掺杂黑色背景,因此将这些像素点进行遍历筛查,得到两列文字投影的中间坐标,筛查算法为:若第一个位白色,则从第二个开始,每隔两个计算当前像素点与下一个像素点的平局值保存到新的数组中;若第一个为黑色,则从第三个开始,每个两个计算当前像素点与下一个像素点的平均值保存到新的数组中,如图9所示。这样新的数组存储的便是两列文字投影的中间坐标,然后计算整个碑帖图像的列数col_num等于数组长度L减1,公式表示为col_num=L-1。得到碑帖图像的列数后,就可以设定每一列的宽度为固定值every_col,然后计算需要将这个碑帖图像缩放的总宽度W=every_col*col_num,再根据这个宽度对二值化图像变形,最后进行二次列投影。在二次列投影中二次列投影为真实列投影,设定腐蚀核为col_num,col_num,设定膨胀核为2*col_num,2*col_num,膨胀核要比腐蚀核大,需要将文字笔画间隙填充,以便投影区域间隙少。然后进行二次列投影,采用上述同样方法,记录相应坐标,把坐标变换到原图中对应的坐标,然后在原图上进行切割,碑帖图像就会被切割成多列。对列切割得到的图像进行行切割,采用的方法与列切割类似,行数估计方法也相同,在进行行切割过程中,由于对每一列文字进行切割,会导致例如“二”这类文字容易造成行预估不准确,直接影响后续二次切割,所以需要添加校验算法来判断这类结构的文字。算法描述如图10所示。每张图片大小和文字的行数、列数不同,对图像进行膨胀腐蚀操作时,无法针对不同的图像调整膨胀和腐蚀核的尺寸。所以,固定每一列的宽度,针对每一列的宽度调整合适的膨胀和腐蚀核的尺寸,这样不论图像大小和文字列数如何变化,都遵循这个核的大小,可以避免过度膨胀和过度腐蚀,达到了自适应的目的1通过校验算法,可以减少部分上下结构文字对文字预估的影响,在二次行切割过程中,仍需要进行校验,目的在于保证上下结构的文字被正确切割。最后切割操作需要在列切割后的图像上进行。3、图像降噪列切割和行切割均在原图进行切割,所以需要降噪的图像也是原图切割下来的每个文字图像。首先将图像进行增强处理,再做滤波处理和灰度化处理,这样得到的图像噪点平滑,然后根据平均像素值做二值化处理,二值化处理得到的图像大部分噪点也被清除,原因是做增强后灰度图的轮廓更加清晰噪点也更加平滑,所以经过平均像素的二值化处理后可以清理这部分噪点。得到的二值化图像仍存在小噪点和文字边框噪点,首先清除小噪点,采取的方式如下:将图像转换为黑底白字的w*h大小,统一大小以便于进行腐蚀和膨胀操作;开运算来清除小噪点;对操作后的图像做均值滤波处理,这样得到的图像就主要存在边框噪点和外围噪点。在清理边框噪点过程中分为两步,第一步采取掩膜运算,第二步采用横向和纵向投影清理。清理边框噪点:首先进行腐蚀,目的在于清理边框区域白色像素,然后进行两次膨胀处理,第一次为恢复文字笔画主体,第二次为大范围填充白色笔画区域,以便识别整理轮廓;采用ROI识别算法识别出整体区域,建立纯黑色背景,将ROI区域变换到腐蚀和膨胀前的图像中,再将这部分区域移植到纯黑色背景,这样,边框噪点就得以清除。清理外围噪点:在清理边框噪点的基础上,外围噪点主要存在于文字边缘。清理外围噪点仍然采用投影方式,为了调整卷积核到合适的大小,这里仍采用图像缩放的方式,首先将图像缩放到w,h,然后进行腐蚀操作,目的在于完全清理文字外围噪点;腐蚀后的图像文字笔画也会被腐蚀掉,直接投影导致投影区域过小,因此还需进行膨胀操作,以填充笔画间隙和还原文字主体轮廓区域。对膨胀后的图像进行横向和纵向投影,分别获取白色像素点分布的最小和最大坐标,共4个点。将横向和纵向投影的点两两组合,这样就得到要切割的四个坐标点,然后将四个坐标点返回至缩放后的图像中,进行切割,完成外围噪点清理。

权利要求:1.一种基于图像形态学的碑帖文字切割方法,其特征在于,包括如下步骤:步骤1,选取碑帖文字图像进行矫正生成预处理图像;步骤2,对预处理图像进行文字切割生成文字图像;步骤3,对文字图像进行降噪处理;其中,所述步骤2中对预处理图像进行文字切割生成文字图像步骤包括:2.1,对预处理图像进行增强、灰度化处理生成灰度图像;2.2,对灰度图像进行二值化处理后转成黑白图像;2.3,对黑白图像进行第一次列投影,估算图像文字列数,更改图像宽度为“列固定宽度”*“估计的列数”;2.4,对黑白图像进行第一次列投影处理获得该图列宽度;2.5,对调整后的黑白图像进行第二次列投影处理获取列投影切割坐标;2.6,根据列投影切割坐标,在文字图像进行切割生成文字图像。2.根据权利要求1所述的一种基于图像形态学的碑帖文字切割方法,其特征在于,所述步骤1中对选取碑帖文字图像进行矫正生成预处理图像步骤包括:1.1,对选取碑帖文字图像进行增强、灰度化处理生成灰度图像;1.2,对灰度图像进行二值化处理后转成黑白图像;1.3,对黑白图像1.4,对黑白图像进行仿射算法生成预处理图像。3.根据权利要求1所述的一种基于图像形态学的碑帖文字切割方法,其特征在于,所述步骤3对文字图像进行降噪处理步骤包括:3.1,对预处理图像进行增强、灰度化处理生成灰度图像;3.2,对灰度图像进行二值化处理后转成黑白图像;3.3,对黑白图像进行小噪点和文字边框噪点处理生成第一除噪图像;3.4,对第一除噪图像进行边框和外围噪点处理生成第二除噪图像;其中,所述第一除噪图像采用如下步骤:3.31,将图像转换为黑底白字的w*h大小,统一大小方便腐蚀和膨胀;3.32,开运算来清除小噪点;3.33,对操作后的图像做均值滤波处理,其中,所述第二除噪图像采用如下步骤:3.41,对边框噪点进行掩膜运算;3.42,对外围噪点进行横向和纵向投影清理。

百度查询: 天津大学 一种碑帖图像中的文字切割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。