首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度范例的中文文本识别方法 

申请/专利权人:复旦大学;上海兑观信息科技技术有限公司

申请日:2024-02-20

公开(公告)日:2024-06-25

公开(公告)号:CN118247796A

主分类号:G06V30/19

分类号:G06V30/19;G06V30/196;G06V30/28;G06V30/413;G06V10/82;G06N3/0464

优先权:

专利状态码:在审-公开

法律状态:2024.06.25#公开

摘要:本发明公开了一种基于深度范例的中文文本识别方法;该方法主要包含两个部分:范例查询阶段与范例重排序阶段。范例查询阶段主要用于预测识别结果并且定位每一个文字在图像上的位置,同时使用训练集组建成范例库,该范例库包含了每个文字的全局特征和局部特征;范例重排序阶段,主要针对范例查询阶段识别错误的情况,利用在范例库中检索与重排序得到更加准确的结果,纠正形近字的识别错误。本发明通过两个阶段的结合,成功提升了中文文本识别的准确性和效率,为中文识别领域的技术发展贡献了有力的解决方案。

主权项:1.一种基于深度范例的中文文本识别方法,其特征在于,包括以下步骤:步骤一、范例查询阶段首先将场景文本图像输入到特征提取网络中提取特征;然后利用Transformer的编码器结构增强特征提取网络提取的特征;随后在Transformer的解码器结构中学习L个维度为C的文字特征向量,每个向量表示一个文字的全局特征,将学习到的文字特征向量送入到预测头中得到初步的文字识别结果;同时在Transformer的解码器结构中通过注意力机制得到每个文字最相关的若干个局部特征;最后将每个文字的全局特征和局部特征作为要素存入到范例库中;步骤二、范例重排序阶段根据范例查询阶段的预测头对每个文字的识别结果,对于分类置信度低于阈值T的文字,首先通过全局特征在范例库中搜索最相似的若干范例作为备选,随后结合局部特征对这些范例进行重排序,选取分数最高的范例的标签作为该文字的识别结果,重复重排序过程得到一个图片上的所有文字的识别结果。

全文数据:

权利要求:

百度查询: 复旦大学;上海兑观信息科技技术有限公司 基于深度范例的中文文本识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。