买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:桂林电子科技大学
摘要:本发明公开一种融合边缘信息与文本增强的越南语场景文本检测方法及装置,该方法步骤包括:S01.将待测图像输入至主干网络提取出多层特征,以及由EIEM模块基于通道注意力机制提取得到边缘细节信息,将文本边缘细节信息与第一层特征融合;S02.将从主干网络中提取出的顶层特征输入至TREM模块,分别提取全局上下文信息以及字符间的依赖关系,根据TREM模块输出的特征对从主干网络提取出的各层特征进行调节,融合不同层的特征图形成文本区域增强后的特征图;S03.进行文本后处理,得到概率图和自适应阈值图,进行可变二值化操作,得到近似二值图以确定文本框的边界。本发明具有实现方法简单、检测精度高且鲁棒性强等优点。
主权项:1.一种融合边缘信息与文本增强的越南语场景文本检测方法,其特征在于,步骤包括:步骤S01.边缘信息增强:将待测图像输入至主干网络提取出多层特征,以及将待测图像输入至EIEM模块,由所述EIEM模块基于通道注意力机制提取出文本边缘细节信息,将EIEM模块提取出的文本边缘细节信息与从主干网络中提取出的第一层特征X0融合,得到具有边缘信息的中间特征Xmid;步骤S02.文本区域增强:将从主干网络中提取出的顶层特征作为输入特征输入至TREM模块,由TREM模块中MLP部分、SA部分分别提取输入特征的全局上下文信息以及字符间的依赖关系,将MLP部分提取出的全局上下文信息与SA部分提取出的字符间的依赖关系进行融合得到融合特征,根据TREM模块输出的融合特征对从主干网络提取出的各浅层特征进行调节,融合调节后不同层的特征图形成文本区域增强后的特征图F;步骤S03.文本后处理:将文本区域增强后的特征图F进行文本后处理,得到与原始图大小相同的概率图P和自适应阈值图T,对所述概率图P和自适应阈值图T进行可变二值化操作,得到近似二值图以确定文本框的边界。
全文数据:
权利要求:
百度查询: 桂林电子科技大学 融合边缘信息与文本增强的越南语场景文本检测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。