基于深度范例的中文文本识别方法

导航：龙图腾网> 最新专利技术> 基于深度范例的中文文本识别方法

申请/专利权人：复旦大学;上海兑观信息科技技术有限公司

申请日：2024-02-20

公开（公告）日：2024-06-25

公开（公告）号：CN118247796A

主分类号：G06V30/19

分类号：G06V30/19;G06V30/196;G06V30/28;G06V30/413;G06V10/82;G06N3/0464

优先权：

专利状态码：在审-公开

法律状态：2024.06.25#公开

摘要：本发明公开了一种基于深度范例的中文文本识别方法；该方法主要包含两个部分：范例查询阶段与范例重排序阶段。范例查询阶段主要用于预测识别结果并且定位每一个文字在图像上的位置，同时使用训练集组建成范例库，该范例库包含了每个文字的全局特征和局部特征；范例重排序阶段，主要针对范例查询阶段识别错误的情况，利用在范例库中检索与重排序得到更加准确的结果，纠正形近字的识别错误。本发明通过两个阶段的结合，成功提升了中文文本识别的准确性和效率，为中文识别领域的技术发展贡献了有力的解决方案。

主权项：1.一种基于深度范例的中文文本识别方法，其特征在于，包括以下步骤：步骤一、范例查询阶段首先将场景文本图像输入到特征提取网络中提取特征；然后利用Transformer的编码器结构增强特征提取网络提取的特征；随后在Transformer的解码器结构中学习L个维度为C的文字特征向量，每个向量表示一个文字的全局特征，将学习到的文字特征向量送入到预测头中得到初步的文字识别结果；同时在Transformer的解码器结构中通过注意力机制得到每个文字最相关的若干个局部特征；最后将每个文字的全局特征和局部特征作为要素存入到范例库中；步骤二、范例重排序阶段根据范例查询阶段的预测头对每个文字的识别结果，对于分类置信度低于阈值T的文字，首先通过全局特征在范例库中搜索最相似的若干范例作为备选，随后结合局部特征对这些范例进行重排序，选取分数最高的范例的标签作为该文字的识别结果，重复重排序过程得到一个图片上的所有文字的识别结果。

全文数据：

权利要求：

百度查询：复旦大学;上海兑观信息科技技术有限公司基于深度范例的中文文本识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种金属管件抛光打磨装置

下一篇：一种装配式铝方通转角拼接结构

相关技术

一种金属管件抛光打磨装置

一种装配式铝方通转角拼接结构

一种裁断效果好的液压裁断机

一种锂电池外壳冲压设备

一种墙面保护用裁边边压片

一种带液晶显示屏可调速的墙体切割机

一种互动茶几安全防护围挡

一种带支架的手把及设有该手把的行李箱

一种监测作物生长状况的农业装置

一种建筑施工用抹灰装置

一种用于消毒的泵芯组装机

一种多功能存储罐应急逃生梯

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度范例的中文文本识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务