买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:京东方科技集团股份有限公司;北京京东方技术开发有限公司
摘要:本文公开名片的文本识别方法、装置及存储介质。所述方法包括:从每一个名片样本的图像中按照文本数据类型提取出每种文本数据的子图像;对所述名片样本的任意一种文本数据的子图像进行文本衍生和变换,得到所述子图像对应的衍生文本图像;将所述名片样本集合中的每张名片样本的所有文本数据的子图像以及对应的衍生文本图像一起作为训练数据集中的样本;建立基于卷积神经网络的名片文本识别模型,利用训练数据集对模型进行训练得到训练后的模型;将待识别名片的图像数据输入所述模型进行文本识别处理。本文自动扩大了模型训练数据集的数据量,提高了名片文本识别的准确性。
主权项:1.一种名片的文本识别方法,包括:从每一个名片样本的图像中按照文本数据类型提取出每种文本数据的子图像;对所述名片样本的任意一种文本数据的子图像进行文本衍生和变换,得到所述子图像对应的衍生文本图像;将所述名片样本集合中的每张名片样本的所有文本数据的子图像以及对应的衍生文本图像一起作为训练数据集中的样本;建立基于卷积神经网络的名片文本识别模型,利用所述训练数据集对所述名片文本识别模型进行训练,得到训练后的名片文本识别模型;将待识别名片的图像数据输入所述名片文本识别模型进行文本识别处理;其中,对所述名片样本的任意一种文本数据的子图像进行文本衍生和变换,包括:对所述名片样本的任意一种文本数据的子图像进行文本识别确定文本内容和文本构造规则,根据所述文本构造规则对所述文本内容进行变换生成至少一条衍生文本数据:根据文本数据的构造规则将所述文本数据的内容分割成至少一个原始字段,对每个原始字段的内容进行至少一次变换生成至少一个变换字段,由原始字段和变换字段的组合,以及变换字段和变换字段的组合生成至少一条新的衍生文本数据;提取所述子图像的背景纹理数据,将每一条衍生文本数据与所述背景纹理数据进行融合生成融合图像,对所述融合图像进行字体变换和图像变换得到衍生文本图像;所述图像变换包括:背景纹理的变换;所述背景纹理的变换包括以下至少一种:旋转、缩放和裁剪。
全文数据:
权利要求:
百度查询: 京东方科技集团股份有限公司 北京京东方技术开发有限公司 名片的文本识别方法、装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。