首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】海关M2M场景下的非结构化随附单据信息提取方法及系统_重庆大学_202410365007.7 

申请/专利权人:重庆大学

申请日:2024-03-28

公开(公告)日:2024-06-07

公开(公告)号:CN118155235A

主分类号:G06V30/42

分类号:G06V30/42;G06V30/413;G06V10/82;G06V30/262;G06N3/0455;G06N3/042;G06N3/082

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.25#实质审查的生效;2024.06.07#公开

摘要:本发明涉及OCR信息提取技术领域,具体公开了一种海关M2M场景下的非结构化随附单据信息提取方法及系统,其基于增强型MobileNet‑V1网络和预训练的SVTR网络构建了基准模型,并构建了该基准模型的孪生模型,从而对该基准模型和孪生模型采用GTC训练策略及基于互学习的知识蒸馏优化方法进行训练,训练后的基准模型或孪生模型能够准确地提取海关非结构化随附单据中的编码类字段、字符类字段和数值类字段,显著提升了海关M2M场景下的信息提取准确率和结果置信度。另外,本发明还基于知识图谱提出了对模型识别结果的后处理方法,以对OCR识别结果进行校正校验,以进一步提升识别准确率。

主权项:1.海关M2M场景下的非结构化随附单据信息提取方法,其特征在于,包括步骤:S1、构建基准模型;所述基准模型包括顺序连接的图像分割模块、增强型MobileNet-V1网络、预训练的SVTR网络和全连接层;海关M2M场景下的海关随附单据图像经所述图像分割模块进行分割后输入所述增强型MobileNet-V1网络进行特征提取,得到字符组件,并将该字符组件和位置信息拼接后输入所述SVTR网络;所述SVTR网络进行特征提取,得到特征序列输入到所述全连接层中进行字符识别,得到字符识别结果;M2M指终端到终端;S2、构建所述基准模型的孪生模型;S3、采用GTC训练策略及基于互学习的知识蒸馏优化方法对所述基准模型和所述孪生模型进行训练;该GTC训练策略是结合了注意力机制和连接主义时间分类机制的训练策略;S4、将步骤S3训练完成的所述基准模型或所述孪生模型用于对任一待识别的海关随附单据图像的识别,得到识别结果。

全文数据:

权利要求:

百度查询: 重庆大学 海关M2M场景下的非结构化随附单据信息提取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。