首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

面向复杂环境的印章文字检测识别方法、装置及介质 

申请/专利权人:平安科技(深圳)有限公司

申请日:2020-06-22

公开(公告)日:2024-06-28

公开(公告)号:CN111767911B

主分类号:G06V30/14

分类号:G06V30/14;G06V30/148;G06V30/146;G06V30/18;G06V30/19;G06V10/82;G06N3/0464;G06N3/0455;G06N3/0442

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2020.11.20#实质审查的生效;2020.10.13#公开

摘要:本发明涉及人工智能,公开了一种面向复杂环境的印章文字检测识别方法、装置及介质,方法包括:获取待处理的文档图片;对文档图片进行印章检测定位,并提取印章图片;对印章图片进行文本检测,并分割得到曲形文本区域;将曲形文本区域由曲线形转变为直线形,得到直线形文本图片;将直线形文本图片输入文字识别模型,得到印章中的文字信息;其中,文字识别模型采用SAR网络进行文字识别,SAR网络包括ResNet模块,用于提取文字特征,获取特征向量;基于LSTM编码器‑解码器的框架,框架包括LSTM编码器和解码器;注意力模块,用于向解码器施加注意力机制。本发明对印章进行端对端的检测识别,对印章的背景文本干扰的鲁棒性较高。

主权项:1.一种面向复杂环境的印章文字检测识别方法,其特征在于,所述方法包括:获取待处理的文档图片;对所述文档图片进行印章检测定位,并根据检测定位结果提取印章图片,其中,所述印章图片为包括印章的最小矩形图片;对所述印章图片进行文本检测,并分割得到印章中的曲形文本区域;将曲形文本区域由曲线形转变为直线形,得到直线形文本图片;将所述直线形文本图片输入文字识别模型,得到印章中的文字信息;其中,所述文字识别模型采用SAR网络进行文字识别,所述SAR网络包括ResNet模块,用于提取文字特征,并获取特征向量;基于LSTM编码器-解码器的框架,所述框架包括LSTM编码器和解码器;注意力模块,用于向解码器施加注意力机制;通过所述ResNet模块获取特征向量,将所述特征向量输入所述LSTM编码器中获得隐藏状态向量;将隐藏状态向量输入施加了注意力机制的解码器中,获得印章中的文字信息;其中,将曲形文本区域由曲线形转变为直线形,得到直线形文本图片的步骤包括:假设曲形文本区域为圆形区域的一部分,获取所述圆形区域的圆心坐标和圆半径;根据所述圆心坐标和圆半径估算曲形文本区域对应的圆弧区域,得到所述圆弧区域起点及终点所对应的弧度,并获取所述圆弧区域的最小半径和最大半径;根据所述圆心坐标、最小半径、最大半径和所述圆弧区域起点及终点所对应的弧度,将直线形文本图片中的坐标对应到印章图片中的坐标,从而将曲形文本区域映射到矩形区域,得到直线形文本图片;其中,通过下式将直线形文本图片中的坐标对应到印章图片中的坐标, 其中,c0,c1表示圆心坐标,r表示圆弧区域的最小半径,R表示圆弧区域的最大半径,α表示圆弧区域起点及终点所对应的弧度,x,y表示直线形文本图片中的坐标,x′,y′表示坐标x,y对应到印章图片中的坐标。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 面向复杂环境的印章文字检测识别方法、装置及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。