买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京远舢智能科技有限公司
摘要:本申请提供了一种表格识别方法和装置,其中,该方法包括:获取包含有表格的待识别图片;识别待识别图片中的文本内容,并在每个文本内容所在位置处创建一边界框以框住文本内容;针对每个待识别节点,基于待识别节点之间的位置关系,确定该待识别节点对应的多个目标待识别节点,并创建该待识别节点与每个目标待识别节点之间的连接边,每个连接边的边属性包括目标待识别节点与该待识别节点之间的第一识别距离值以及目标待识别节点相对于该待识别节点的识别角度值;根据所有待识别节点的节点属性和所有连接边的边属性,生成电子版表格。通过本申请,提高了表格识别的准确性。
主权项:1.一种表格识别方法,其特征在于,包括:获取包含有表格的待识别图片;识别所述待识别图片中的文本内容,并在每个文本内容所在位置处创建一边界框以框住文本内容;针对每个待识别节点,基于待识别节点之间的位置关系,确定该待识别节点对应的多个目标待识别节点,并创建该待识别节点与每个目标待识别节点之间的连接边,其中,每个待识别节点指从对应的边界框中选取的一点,每个待识别节点的节点属性包括该待识别节点对应的边界框内包含的文本内容,每个连接边的边属性包括目标待识别节点与该待识别节点之间的第一识别距离值以及目标待识别节点相对于该待识别节点的识别角度值;根据所有待识别节点的节点属性和所有连接边的边属性,生成电子版表格。
全文数据:
权利要求:
百度查询: 北京远舢智能科技有限公司 一种表格识别方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。