首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种文本版面分析方法、装置、设备和介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:苏州开心盒子软件有限公司

摘要:本发明实施例公开了一种文本版面分析方法、装置、介质及电子设备,其中,该方法包括:获取待分析的文本图像,对所述文本图像进行预处理;将所述文本图像输入语义分割算法模型进行版面分析,以确定所述文本图像中的版面元素;其中,所述语义分割算法模型包含编码阶段和解码阶段;所述编码阶段,用于将残差网络模型中不同阶段的高语义特征与高分辨率网络分支中的高分辨率语义特征以元素相加的方式进行特征融合;所述解码器阶段,用于将所述编码阶段最后一个阶段提取的高语义特征上采样后与所述编码阶段最后一个特征融合单元输出的高分辨率语义特征以拼接的方式进行特征融合,以确定所述文本图像中的版面元素。本发明实施例提高了版面分析的识别效果。

主权项:1.一种文本版面分析方法,其特征在于,包括:获取待分析的文本图像,对所述文本图像进行预处理;将所述文本图像输入语义分割算法模型进行版面分析,以确定所述文本图像中的版面元素;其中,所述语义分割算法模型包含编码阶段和解码阶段;所述编码阶段,用于将残差网络模型中不同阶段的高语义特征与高分辨率网络分支中的高分辨率语义特征以元素相加的方式进行特征融合;解码器阶段,用于将所述编码阶段最后一个阶段提取的高语义特征上采样后与所述编码阶段最后一个特征融合单元输出的高分辨率语义特征以拼接的方式进行特征融合,以确定所述文本图像中的版面元素;所述编码阶段为残差网络模型和DenseASPP模型组成,则通过所述残差网络模型提取不同阶段的高语义特征,包括:所述残差网络模型Resnet-50包含4个网络单元;每个网络单元,用于提取对应阶段的高语义特征;所述提取对应阶段的高语义特征,包括:Resnet-50中4个不同阶段的网络单元分别包含多个瓶颈残差模块;Resnet-50前3个网络单元中的第1个瓶颈残差模块会对输入文本图像特征进行下采样,以更新当前网络单元输入特征的分辨率,其中,每个单元中的后续瓶颈残差模块提取高语义特征,将当前网络单元提取的高语义特征分别输入至下一个网络单元和特征融合单元,并作为第一阶段输出的高语义特征;Resnet-50中第四个网络单元中的瓶颈残差模块采用膨胀空洞卷积操作在保持第四阶段特征分辨率的同时扩大感受野;将Resnet-50中第四个网络单元输出的高语义特征输入DenseASPP模型进行多尺度特征融合操作,以提取高语义特征;所述编码阶段,用于将残差网络模型中不同阶段的高语义特征与高分辨率网络分支中的高分辨率语义特征以元素相加的方式进行特征融合,包括:将所述高分辨率网络分支的高分辨率特征通过3×3卷积层和BN正则化层后,获取待融合的高分辨率特征;同时,将残差网络模型中第一阶段输出的高语义特征通过1×1卷积层和BN正则化层,并将该所述高语义特征的通道数降维至与所述待融合的高分辨率特征通道数一致,再通过双线性插值上采样将高语义特征的大小与所述待融合的高分辨率语义特征的大小保持一致,获得处理后的第一阶段高分率融合语义特征;以元素相加的方式将所述处理后的第一阶段高分率融合语义特征与所述待融合的高分辨率语义特征进行融合后,获得融合高分辨率语义特征;将所述融合高分辨率语义特征通过Relu激活层后,依次输入3×3卷积层、BN正则化层和Relu激活层进行处理后,以作为第二阶段输入的高分辨率语义特征;循环上述步骤,获得残差网络模型中第四阶段输出的高语义特征,第三个特征融合单元输出的高分辨率语义特征;将所述第四阶段输出的高语义特征输入DenseASPP模型进行处理,再经上采样后与所述第三个特征融合单元输出的高分辨率语义特征以拼接的方式进行特征融合后,通过3×3卷积层、BN正则化层、Relu激活层,以确定融合后输出图像特征。

全文数据:

权利要求:

百度查询: 苏州开心盒子软件有限公司 一种文本版面分析方法、装置、设备和介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。