买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司
摘要:本申请公开了一种去除文档图像透字的方法。对文档图像进行切边,仅保留文档区域。采用双边滤波方式构建训练数据集。构建一种基于卷积神经网络的深度学习模型,采用一种端到端的强化式NUNet网络结构。采用所述训练数据集对所述深度学习模型进行训练,使其同时对文档图像进行透字去除与图像特征提取;图像特征提取用来在去除透字过程中提升图像的清晰度。采用训练好的所述深度学习模型对输入的文档图像进行处理后输出,所述处理是在去除透字的同时提升图像的清晰度。本申请不仅可以高效的去除文档图像中透字的区域,还可以充分保留文档正面字符,提高文档图像的清晰度和可读性。
主权项:1.一种去除文档图像透字的方法,其特征是,包括如下步骤;步骤S1:对文档图像进行切边,去除非文档区域,仅保留文档区域;步骤S2:采用双边滤波方式构建训练数据集;首先拍摄和或收集含有透字现象的文档图像,并裁剪出文档区域;然后将裁剪后的文档图像使用双边滤波方式过滤,滤除文档中透字的区域;双边滤波处理前、后的文档图像构成一对训练数据;步骤S3:构建一种基于卷积神经网络的深度学习模型,所述深度学习模型采用一种端到端的强化式NUNet网络结构;所述步骤S2和步骤S3的顺序或任意在前、或同时进行、或交叉进行;步骤S4:采用所述训练数据集对所述深度学习模型进行训练,使其同时对文档图像进行透字去除与图像特征提取;图像特征提取用来在去除透字过程中提升图像的清晰度;步骤S5:采用训练好的所述深度学习模型对输入的文档图像进行处理后输出,所述处理是在去除透字的同时提升图像的清晰度。
全文数据:
权利要求:
百度查询: 上海合合信息科技股份有限公司 上海临冠数据科技有限公司 上海生腾数据科技有限公司 上海盈五蓄数据科技有限公司 一种去除文档图像透字的方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。