首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于版面分析的通用场景卡证识别系统 

申请/专利权人:山东浪潮科学研究院有限公司

申请日:2024-04-01

公开(公告)日:2024-06-25

公开(公告)号:CN117975466B

主分类号:G06V30/148

分类号:G06V30/148;G06V30/16;G06V30/19

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2024.05.21#实质审查的生效;2024.05.03#公开

摘要:本发明涉及计算机视觉识别技术领域,具体涉及一种基于版面分析的通用场景卡证识别系统,包括图像预处理模块、深度特征卡证检测模块、自适应版面分析模块、文本数据提取模块、数据整合模块以及反馈调整模块;其中,图像预处理模块:接收原始卡证图像作为输入,并对原始卡证图像进行图像预处理,以输出优化后的图像;深度特征卡证检测模块:基于优化后的图像,应用深度学习算法进行卡证区域和类别的识别。本发明,通过自适应版面分析和深度特征检测技术的融合使用,不仅显著提高了卡证识别的准确性和效率,还强化了关键信息区域的识别能力,并具备灵活适应新卡证类型与快速更新的能力,确保了系统的高效性、可靠性及前瞻性。

主权项:1.一种基于版面分析的通用场景卡证识别系统,其特征在于,包括图像预处理模块、深度特征卡证检测模块、自适应版面分析模块、文本数据提取模块、数据整合模块以及反馈调整模块;其中,图像预处理模块:接收原始卡证图像作为输入,并对原始卡证图像进行图像预处理,以输出优化后的图像;深度特征卡证检测模块:基于优化后的图像,应用深度学习算法进行卡证区域和类别的识别,并输出卡证位置、尺寸信息及类别标签;自适应版面分析模块:基于卡证类别标签,选择并适合该类别卡证的版面分析模型,并通过选择的版面分析模型分析处理后的图像,以识别出关键信息区域;文本数据提取模块:基于自适应版面分析模块识别的关键信息区域,通过OCR技术提取该关键信息区域的文本数据;数据整合模块:整合从文本数据提取模块接收的文本数据,并将文本数据转换为结构化的卡证数据格式;反馈调整模块:分析识别过程的误差和精度,将结果反馈至深度特征卡证检测模块和自适应版面分析模块,用于指导调整和优化参数;所述深度特征卡证检测模块包括图像特征提取单元、区域提议单元以及分类定位单元;其中,图像特征提取单元:接收优化后的图像作为输入,并应用预训练的深度卷积神经网络模型,以提取图像的深度特征表示,具体操作公式表示为: ,其中代表输入图像的像素矩阵,和分别表示卷积层的权重和偏置,表示提取的特征映射;区域提议单元:以图像特征提取单元的输出作为输入,利用选择性搜索算法生成候选区域;分类定位单元:对每个候选区域,应用预设的CNN模型,执行两个并行的任务,其中一个是分类任务,具体通过softmax函数预测候选区域的类别标签;另一个是定位任务,使用回归技术预测卡证的位置和尺寸,所述分类任务的输出公式表示为:,其中,是给定特征下类别的条件概率,是特征在类别上的得分,是特征在类别上的得分,所述定位任务的输出为四元组:,分别表示卡证区域的中心点坐标和尺寸;所述区域提议单元中利用选择性搜索算法生成候选区域的步骤包括:初始化阶段:使用图像分割算法将输入图像分割成小区域集合,基于图像的纹理、颜色、尺寸和形状相似性初始化候选区域,该图像分割算法公式表示为:,其中,为初始分割结果,为输入图像,表示图像分割函数;合并阶段:依据预定义的相似性准则迭代合并初始化阶段中分割成的小区域,生成更大的候选区域,相似性准则通过计算区域之间的相似度来评估的,其中和代表两个区域,所述相似度计算公式为: ,其中,分别表示颜色、纹理、尺寸和形状相似度,而为它们相应的权重;输出阶段:重复合并过程直到满足停止条件,该停止条件包括达到预设的区域数量或合并后的区域大小超过预设的阈值,最终输出候选区域作为卡证存在的位置;所述自适应版面分析模块包括场景微调单元以及自适应调用单元;其中,场景微调单元:用于针对不同垂直场景中遇到的各种卡证类型,先行在数据集上对版面分析模型进行精确微调,微调过程包括调整模型参数、优化特征提取层和增强模型对信息项的识别能力,每个场景下得到的微调版面分析模型都能够更好地适应该场景特有的版面布局和信息特征;自适应调用单元:基于场景微调单元得到的各个版面分析模型,自适应调用单元负责根据实际识别需求动态选择最合适的版面分析模型,具体当接收到一个卡证图像进行处理时,该单元首先识别卡证的类型,然后从场景微调单元得到的模型库中选择一个针对该类型卡证微调过的版面分析模型进行调用,以实现针对性的高精度识别。

全文数据:

权利要求:

百度查询: 山东浪潮科学研究院有限公司 一种基于版面分析的通用场景卡证识别系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。