哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)劳明铭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)申请的专利一种面向文本图像的超分辨率方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118505504B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410500537.8,技术领域涉及:G06T3/4053;该发明授权一种面向文本图像的超分辨率方法是由劳明铭;徐勇设计研发完成,并于2024-04-24向国家知识产权局提交的专利申请。
本一种面向文本图像的超分辨率方法在说明书摘要公布了:本发明属于图像处理技术领域,且公开了一种面向文本图像的超分辨率方法,包括:生成文本超分数据集,识别并转换图像中目标文本区域为矩形,以便输入超分网络,提取待超分图像的特征,得到特征图X0,利用文本先验提取模块生成注意力图A,将特征图X0与注意力图A通过多个带注意力机制的残差块进行升维,得到特征图Xn,对特征图Xn进行像素和通道重组,生成超分图像SR,计算SR图像的文本序列损失lctc和像素间损失l2,求得总损失l。通过迭代优化网络参数,评估模型性能,将SR图像输入文本识别模型,获取预测文本,逆变换后拼接到原图,增强视觉效果,有效解决了传统超分模型对于文本图像质量的提升效果有限甚至产生负优化效果的问题。
本发明授权一种面向文本图像的超分辨率方法在权利要求书中公布了:1.一种面向文本图像的超分辨率方法,其特征在于:包括如下步骤:S1:生成文本超分数据集;S2:使用第一预设算法获取图像中目标文本区域的多边形,使用透视变换将该多边形转换为矩形,以输入文本超分网络;S3:对需要超分辨率的图像LR进行特征提取,得到特征图X0;S4:利用文本先验提取模块对图像LR进行文本预测,生成注意力图A;S5:将S3中获取的特征图X0和S4中获取的注意力图A,通过串行连接的n个带通道和空间注意力机制的残差块进行通道升维,期间依次产生特征图X1,…,Xn,所述空间注意力机制为对于来自卷积层的特征图,通道注意力机制将特征图在空间维度上进行压缩,对特征图分别进行平均值池化和最大值池化,得到一维矢量为所述特征图的通道注意力,然后再通过与原始特征图相乘来对特征图施加注意力;S6:对升维后的特征图Xn进行像素重组和通道重组,生成超分图像SR;S7:将SR图像通过文本识别模块获取各个时间步各个字符的预测概率pred,计算pred和真实文本标签gt之间的文本序列损失CTCLoss得到lctc;使用预设函数计算SR图像和LR图像之间像素间损失得到l2,计算lctc与l2的加权和l,所述预设函数包括均方损失函数MSELoss,利用第二预设算法迭代求解网络的最优模型参数,所述第二预设算法包括Adam优化算法最后,计算超分辨率量化指标PSNR和SSIM以及文本的识别精度以评估模型性能;S8:将SR图像输入文本识别模型获取预测文本,按照S2采用的透视变换参数进行逆变换将SR图像复原为原多边形的形状,重新拼接到原图中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),其通讯地址为:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。