文本识别模型训练方法、文本识别方法、装置及存储介质

导航：龙图腾网> 最新专利技术> 文本识别模型训练方法、文本识别方法、装置及存储介质

申请/专利权人：北京百度网讯科技有限公司

申请日：2023-01-06

公开（公告）日：2024-06-28

公开（公告）号：CN116189198B

主分类号：G06V30/19

分类号：G06V30/19;G06V30/41;G06V10/774;G06V10/82;G06N3/0455;G06N3/088;G06N3/0895

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2023.06.16#实质审查的生效;2023.05.30#公开

摘要：本公开提供了一种文本识别模型训练方法、文本识别方法、装置及存储介质。本公开涉及人工智能技术领域，具体为深度学习、图像处理、计算机视觉技术领域，可应用于光学字符识别等场景。具体实现方案为：获取第一训练数据；将第一训练数据输入待训练的目标模型；获取目标模型基于第一训练数据输出的预测文本和预测掩码特征；基于预测文本、预测掩码特征、真实文本和被掩码掉的原始特征，训练目标模型，得到文本识别模型。根据本公开的方案，能够提高文本识别的准确性。

主权项：1.一种文本识别模型训练方法，包括：获取第二训练数据，其中，所述第二训练数据包括多场景下的不带有标注结果的纯图像数据，所述纯图像数据是以行级别图像形式存在的；将所述第二训练数据输入待训练模型；获取所述待训练模型基于所述第二训练数据输出的重构图像；基于所述重构图像构建无监督损失函数；基于所述无监督损失函数训练所述待训练模型，得到目标模型；获取第一训练数据；将所述第一训练数据输入所述目标模型；获取所述目标模型基于所述第一训练数据输出的预测文本和预测掩码特征；基于所述预测文本、所述预测掩码特征、真实文本和被掩码掉的原始特征，训练所述目标模型，得到文本识别模型；其中，所述目标模型包括第一编码器、第二编码器、解码器和预测器，所述第一编码器和所述第二编码器分别与所述解码器连接，所述解码器与所述预测器连接；其中，获取所述目标模型基于所述第一训练数据输出的预测文本，包括：利用所述第一编码器提取完整图像特征；利用所述解码器对所述完整图像特征进行解码，得到待识别特征；利用所述预测器对所述待识别特征进行预测，得到所述预测文本；其中，获取所述目标模型基于所述第一训练数据输出的预测掩码特征，包括：根据掩码率对所述第二编码器提取的图像特征进行掩码处理；利用所述解码器对掩码处理后的图像特征进行解码，得到所述预测掩码特征。

全文数据：

权利要求：

百度查询：北京百度网讯科技有限公司文本识别模型训练方法、文本识别方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于塑料制品生产的表面加工装置

下一篇：一种零部件加工的表面喷漆装置

相关技术

一种用于塑料制品生产的表面加工装置

一种零部件加工的表面喷漆装置

一种摆动机构及鼓风干燥箱

一种纸尿裤生产用包边机

一种空调器自清洁系统油污沉淀装置

一种茶叶生产用高效翻炒装置

一种液体沥青取样装置

一种螺旋输送装置

一种用于无级变速器的传动带金属环结构

一种薄荷醇制取用原料粉碎装置

一种酶转化罐内部恒温搅拌机构

一种用于光伏发电装置的R型回转减速机

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

文本识别模型训练方法、文本识别方法、装置及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务