恭喜南昌航空大学钟婧婷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南昌航空大学申请的专利一种形变表格结构识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114973283B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210573606.9,技术领域涉及:G06V30/412;该发明授权一种形变表格结构识别方法是由钟婧婷;杨词慧;叶小丽设计研发完成,并于2022-05-24向国家知识产权局提交的专利申请。
本一种形变表格结构识别方法在说明书摘要公布了:本发明公开了一种形变表格结构识别方法,其特征在于,该方法包括以下步骤:图像预处理、字符去除、角点定位、轮廓获取、单元格定位。本发明的优点在于:该方法对于形变表格存在的背景、光照、物理形变等干扰,提供一种形变表格结构识别方法。该方法能够有效去除图像中的字符,准确获取图像中的角点信息,同时定位单元格的位置。此方法能够有效适用于形变表格的结构识别,不仅抗干扰能力强、准确率高,还具有较好的应用前景。
本发明授权一种形变表格结构识别方法在权利要求书中公布了:1.一种形变表格结构识别方法,其特征在于,该方法包括以下步骤:1图像预处理;对输入的含有表格的原始图像i进行图像增强、二值化及骨架提取,得到第一二值图像I1;2字符去除;采用字符去除算法将第一二值图像I1中存在的大部分字符去除,得到第二二值图像I2;然后进一步判断像素点四个邻接矩形区域中黑色像素点的个数,将第二二值图像I2中的所有字符去除,得到第三二值图像I3;3角点定位;首先采用角点检测算法对第三二值图像I3中的角点进行检测,得到第一角点集合P1;然后对第一角点集合P1中的角点进行聚类,得到第二角点集合P2;最后对第二角点集合P2中不符合条件的角点进行筛选,得到原始图像I的角点集合P3;4轮廓获取;将第三二值图像I3水平方向上宽度为1的像素删除,获取只保留水平线的第四二值图像I4;获取第四二值图像I4中所有的轮廓Con1,Con2,..,Conβ,其中β为第四二值图像I4中的轮廓总数;5单元格定位;对角点集合P3中的所有角点进行分类,将角点集合P3中属于轮廓的角点加入到点集其中得到角点集合point1,point2,...,pointβ;然后根据角点集合point1,point2,...,pointβ中的每一个角点的位置,确定原始图像i中每一个单元格的左上角顶点、右上角顶点、右下角顶点、左下角顶点的坐标,得到单元格坐标集合CP;上述步骤1中对输入的含有表格的原始图像I进行图像增强、二值化及骨架提取,具体采用了以下方法:1.1对输入的原始图像I采用图像增强算法进行图像增强,得到图像增强结果图像I01,然后采用图像二值化算法对图像增强结果图像I01进行图像二值化,得到图像增强结果二值图像I02;1.2采用骨架提取算法对图像增强结果二值图像I02进行骨架提取,得到第一二值图像I1:上述步骤2中采用字符去除算法将第一二值图像I1中存在的大部分字符去除,具体采用了以下方法:2.1遍历第一二值图像I1中的每一个像素点,通过像素点的八邻域邻接关系提取第一二值图像I1中的连通区域Areaj,其中j=1,2,…,N,N为第一二值图像I1中连通区域的总数,将提取到的所有连通区域存储在连通区域集合Area中;2.2对于每一个连通区域Areaj,通过对以下行列式进行求解,计算连通区域Areaj的协方差矩阵Sj的特征值λjt,其中t=1,2, 其中,分别表示连通区域Areaj中所有像素点的横坐标平均值和纵坐标平均值,xj和yj分别表示连通区域Areaj中像素点的横坐标和纵坐标,j=1,2,…,N,N为第一二值图像I1中连通区域的总数;2.3遍历连通区域集合Area中的每一个连通区域Areaj,对连通区域Areaj的协方差矩阵Sj的特征值进行判断,其中j=1,2,…,N,N为第一二值图像I1中连通区域的总数,如果特征值满足 其中,th2、th3、th4为设置的阈值,Cj为连通区域Areaj的像素点数,且连通区域Areaj的像素点数Cj满足Cj<th47则将该连通区域Areaj从连通区域集合Area中删除,即可得到第二二值图像I2;上述步骤2中进一步判断像素点四个邻接矩形区域中黑色像素点的个数,将第二二值图像I2中的所有字符去除,得到第三二值图像I3,具体采用了以下方法:2.4遍历第二二值图像I2中每一个像素点,将灰度值为0的像素点存储于集合WP中;集合WP中每一个像素点poα,设其横坐标为xα、纵坐标为yα,上邻接矩形区域Rect1左上角坐标点的横坐标为xα-λ1、纵坐标为yα-λ2,右下角坐标点的横坐标为xα+λ1、纵坐标为yα;下邻接矩形区域Rect2左上角坐标点的横坐标为xα-λ1、纵坐标为yα,右下角坐标点的横坐标为xα+λ1、纵坐标为yα+λ2;左邻接矩形区域Rect3左上角坐标点的横坐标为xα-λ2、纵坐标为yα-λ1,右下角坐标点的横坐标为xα、纵坐标为yα+λ1;右邻接矩形区域Rect4左上角坐标点的横坐标为xα、纵坐标为yα-λ1,右下角坐标点的横坐标为xα+λ2、纵坐标为yα+λ1,其中λ1、λ2为设定的坐标距离阈值;计算像素点poα上、下、左、右四个邻接矩形区域Rect1、Rect2、Rect3、Rect4中黑色像素点的个数其中α=1,2,...,M,M为集合WP中像素点总数;2.5对于像素点poα的邻接矩形区域Recti,其中i=1,2,3,4;如果其黑色像素点的个数大于1,则将邻接矩形区域Recti的黑色像素存在值赋值1,反之为0: 2.6计算像素点poα的四个邻接矩形区域的黑色像素存在值之和Cα,计算公式如下: 2.7若像素点poα四个邻接矩形区域的Cα值为1,则将该像素点poα视为端点,将该像素点poα添加到集合EP中;若像素点poα四个邻接矩形区域的Cα值为2,则将该像素点poα视为连接点,将该像素点poα添加到集合LP中;其他情况则将该像素点poα视为交叉点,将该像素点poα添加到集合IP中;2.8对集合EP、LP中的噪声点进行滤除,得到第三二值图像I3。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南昌航空大学,其通讯地址为:330000 江西省南昌市丰和南大道696号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。