买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:赞塔(杭州)科技有限公司
摘要:本说明书实施例提供信息提取方法,其中所述信息提取方法包括:对目标图像进行文本检测,得到文本区域的位置信息以及所述文本区域内的文本;识别所述目标图像中的表格结构,得到单元格的位置信息;基于所述单元格的位置信息和所述文本区域的位置信息将对应同一单元格的所述文本区域内的文本进行聚合,得到所述同一单元格对应的文本;利用信息提取模型从目标单元格对应的文本中提取目标信息,所述目标单元格至少包括经过所述聚合的单元格。这样,能够避免在利用信息提取模型提取信息时,同一单元格对应的文本被分散,导致无法准确提取信息。
主权项:1.一种信息提取方法,其特征在于,包括:对目标图像进行文本检测,得到文本区域的位置信息以及所述文本区域内的文本;识别所述目标图像中的表格结构,得到单元格的位置信息;基于所述单元格的位置信息和所述文本区域的位置信息将对应同一单元格的所述文本区域内的文本进行聚合,得到所述同一单元格对应的文本;利用信息提取模型从目标单元格对应的文本中提取目标信息,所述目标单元格至少包括经过所述聚合的单元格。
全文数据:
权利要求:
百度查询: 赞塔(杭州)科技有限公司 信息提取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。