首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种文档图像版面分析方法_南昌航空大学_202410316346.6 

申请/专利权人:南昌航空大学

申请日:2024-03-20

公开(公告)日:2024-05-24

公开(公告)号:CN117912039B

主分类号:G06V30/412

分类号:G06V30/412;G06V30/413;G06V30/42;G06V30/18;G06V30/146

优先权:

专利状态码:有效-授权

法律状态:2024.05.24#授权;2024.05.07#实质审查的生效;2024.04.19#公开

摘要:本发明公开了一种文档图像版面分析方法,该方法包括以下步骤:步骤S1;文档图像预处理:读取文档图像,对文档图像进行图像去噪、图像纠偏、干扰线去除预处理操作,得到预处理后的图像;步骤S2;版面基元识别:采用目标检测算法对预处理后的图像中的版面基元进行检测,得到版面基元的位置、类别,并根据版面基元的类别,将版面基元加入对应的版面基元集合中;步骤S3;版面基元修正:对版面基元集合中版面基元进行修正,得到修正后的版面基元。本发明的有益效果是:本发明可以准确地识别出版面中的各种版面基元。本发明适用于对各类文档图像的版面分析,可有效地提高版面分析结果的准确性。

主权项:1.一种文档图像版面分析方法,其特征在于:该方法包括以下步骤:步骤S1;文档图像预处理:读取文档图像I,对文档图像I进行图像去噪、图像纠偏、干扰线去除预处理操作,得到预处理后的图像Ip;步骤S2;版面基元识别:采用目标检测算法对预处理后的图像Ip中的版面基元进行检测,得到版面基元的位置、类别,并根据版面基元的类别,将版面基元加入对应的版面基元集合中;步骤S3;版面基元修正:对版面基元集合中版面基元进行修正,得到修正后的版面基元;其中对版面基元集合中版面基元进行修正分别为表格基元修正、文本基元修正和标题基元修正;如果版面基元的类别是文本,将版面基元的类别加入到文本基元集合TXS;如果版面基元的类别是表格,将版面基元的类别加入表格基元集合TS;如果版面基元的类别是标题,将版面基元的类别加入标题基元集合ES;如果版面基元的类别是其他,将版面基元的类别加入其它基元集合中;表格基元修正,遍历表格基元集合TS中的每一个表格基元,令pna表示当前遍历的第na个表格基元,na=1,2,…,n,n为表格基元集合TS中的表格基元的个数;采用以下步骤对当前遍历的第na个表格基元pna进行修正:步骤S31,令xlt表示当前遍历的第na个表格基元pna的左上角顶点的x坐标,令ylt表示当前遍历的第na个表格基元pna的左上角顶点的y坐标,令xrb表示当前遍历的第na个表格基元pna的右下角顶点的x坐标,令yrb表示当前遍历的第na个表格基元pna的右下角顶点的y坐标;设置线段端点x坐标的容差阈值tx,设置线段端点y坐标的容差阈值ty;设置a为直线段检测范围水平扩边阈值,设置b为直线段检测范围垂直扩边阈值,设置线段长度容差阈值tl;步骤S32,以xlt-a为左上角顶点x坐标、ylt-b为左上角顶点y坐标、xrb+a为右下角顶点x坐标、ylt+b为右下角顶点y坐标,在预处理后的图像Ip中截取一个子图像Is1;以xlt-a为左上角顶点x坐标、yrb-b为左上角顶点y坐标、xrb+a为右下角顶点x坐标、yrb+b为右下角顶点y坐标,在预处理后的图像Ip中截取一个子图像Is2;以xlt-a为左上角顶点x坐标、ylt-b为左上角顶点y坐标、xlt+a为右下角顶点x坐标、yrb+b为右下角顶点y坐标,在预处理后的图像Ip中截取一个子图像Is3;以xrb-a为左上角顶点x坐标、ylt-b为左上角顶点y坐标、xrb+a为右下角顶点x坐标、yrb+b为右下角顶点y坐标,在预处理后的图像Ip中截取一个子图像Is4;步骤S33,分别在子图像Is1、子图像Is2、子图像Is3、子图像Is4中用直线检测算法检测直线段,得到第一直线段集合L1、第二直线段集合L2、第三直线段集合L3、第四直线段集合L4;步骤S34,分别找出第一直线段集合L1、第二直线段集合L2中的横线段,加入到第一横线段集合Sl1、第二横线段集合Sl2中;分别找出第三直线段集合L3、第四直线段集合L4中的竖线段,加入到第一竖线段集合Sl3、第二竖线段集合Sl4中;步骤S35,如果第一横线段集合Sl1不为空,则在第一横线段集合Sl1中寻找最佳横线段lm1;步骤S36,如果第二横线段集合Sl2不为空,则在第二横线段集合Sl2中寻找最佳横线段lm2;步骤S37,如果第一竖线段集合Sl3不为空,则在第一竖线段集合Sl3中寻找最佳竖线段lm3;步骤S38,如果第二竖线段集合Sl4不为空,则在第二竖线段集合Sl4中寻找最佳竖线段lm4。

全文数据:

权利要求:

百度查询: 南昌航空大学 一种文档图像版面分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。