首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种融合图像和文本的缺线表格识别方法、系统及设备_达观数据有限公司_202410188447.X 

申请/专利权人:达观数据有限公司

申请日:2024-02-20

公开(公告)日:2024-06-07

公开(公告)号:CN118155229A

主分类号:G06V30/412

分类号:G06V30/412;G06V30/19;G06V30/18;G06F40/30

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.25#实质审查的生效;2024.06.07#公开

摘要:本发明公开了一种融合图像和文本的缺线表格识别方法、系统及设备,包括通过图像模型获取表格区域,提取表格线条以及文本,获得原始表格;筛选出线条缺失的单元格,并且对线条缺失的单元格进行纵向线条和或横向线条的构造;纵向线条构造包括:将位于所述单元格横向宽度内的上方表格线条或下方表格线条在纵向投影,判断纵向线条是否缺失;横向线条构造包括:对单元格中的文本进行文本分析,判断所述单元格中的文本内容是否为连续语句,若为不连续语句则在所述单元格中构造横向线条。将图像模型识别和文本识别相结合,同时使用了图像和文本特征,比传统的单纯使用图像特征能够获取更多特征,有更高的识别准确性。

主权项:1.一种融合图像和文本的缺线表格识别方法,其特征在于,包括以下步骤:通过图像模型获取表格区域,提取表格线条以及文本,获得原始表格;筛选出线条缺失的单元格,并且对线条缺失的单元格进行纵向线条和或横向线条的构造;纵向线条构造包括:将位于所述单元格横向宽度内的上方表格线条或下方表格线条在纵向投影,判断所述单元格是否能够进行左右拆开,若存在一条或多条拆分线可以插入所述单元格且不穿过任何文字时,则在所述单元格中构造纵向线条,反之则所述单元格不缺失线条;横向线条构造包括:对单元格中的文本进行文本分析,判断所述单元格中的文本内容是否为连续语句,若为连续语句则所述单元格不缺失线条,若为不连续语句则在所述单元格中构造横向线条。

全文数据:

权利要求:

百度查询: 达观数据有限公司 一种融合图像和文本的缺线表格识别方法、系统及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。