首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于多空间联合感知的街景文本检测方法_福州大学_202111644537.8 

申请/专利权人:福州大学

申请日:2021-12-30

公开(公告)日:2024-06-07

公开(公告)号:CN114332839B

主分类号:G06V20/62

分类号:G06V20/62;G06V10/80;G06V10/82;G06V10/774;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.06.07#授权;2022.04.29#实质审查的生效;2022.04.12#公开

摘要:本发明提供了一种基于多空间联合感知的街景文本检测方法,具体步骤如下:步骤S1:获取自然街景下的文本图像数据集,并将其划分为训练集与测试集;步骤S2:构造基于多空间联合感知的深度卷积神经网络;步骤S3:将训练图像数据集输入到步骤S2构造的网络中进行训练;步骤S4:将测试图像数据集输入至最优参数模型网络中进行预测;步骤S5:采用最小外接矩形算法生成文本实例的检测框,得到检测结果。不仅能够检测出任意形状的街景文本,而且能够保证文本检测的实时性。

主权项:1.一种基于多空间联合感知的街景文本检测方法,其特征在于:具体步骤如下:步骤S1:获取自然街景下的文本图像数据集,并将其划分为训练集与测试集;步骤S2:构造基于多空间联合感知的深度卷积神经网络;步骤S3:将训练图像数据集输入到步骤S2构造的网络中进行训练;步骤S4:将测试图像数据集输入至最优参数模型网络中进行预测;步骤S5:采用最小外接矩形算法生成文本实例的检测框,得到检测结果;步骤S2构造基于多空间联合感知的深度卷积神经网络,由轻量级的特征提取骨干、多尺度空间感知模块以及注意力空间感知模块构成;从特征骨干网络中提取4个不同尺度的特征图,并以此构建多尺度空间感知模块与注意力空间感知模块;将多尺度空间感知模块与注意力空间感知模块在同一尺度上的输出结果进行逐元素加法和上采样操作,从而得到最终用于输出的特征图;步骤S2中构建多尺度空间感知模块增强不同尺度空间上对文本特征的感知,该模块采用深度可分离卷积来减小计算成本,主体结构包含四个阶段:信道降维阶段、自顶向下增强阶段、自底向上增强阶段、深浅层融合增强阶段;步骤S2中构建注意力空间感知模块赋予文本特征注意力权重,利用全局平均池化与1维卷积来关注每个特征通道与范围与其邻近通道间的相关性;步骤S2中经过上采样和拼接操作将不同尺度的特征图融合成一个尺寸为原图大小的14、通道数为512维的特征图,该特征图用于预测文本实例、文本中心实例以像素点嵌入表示;步骤S3中采用损失函数来训练优化网络各层的权重参数,该损失函数由文本实例优化损失函数LText、文本中心实例优化损失函数LCr、嵌入空间亲和度判别损失函数LESD共同构成:文本实例优化损失函数LText,文本中心实例优化损失函数LCr的表达式如下: 式中,H表示交叉熵损失:即i表示第i个像素点;PText、PCr表示文本实例的分割结果;GText、GCr表示真实文本标签区域;嵌入空间亲和度判别损失函数LESD表达式如下: 式中,N是文本实例个数;[x]+表示maxx,0,其中, Tiw表示第i个文本实例;Tit,分别表示第i、j个文本中心实例;fp表示该空间内文本实例像素点的特征向量;fTit,分别表示文本中心实例Tit,的特征向量,可由计算得到;δ在本文中设置为1。

全文数据:

权利要求:

百度查询: 福州大学 一种基于多空间联合感知的街景文本检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。