恭喜南京大学杨育彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京大学申请的专利一种提高图像分辨率的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114549314B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210154779.7,技术领域涉及:G06T3/4053;该发明授权一种提高图像分辨率的方法是由杨育彬;谢佳鑫设计研发完成,并于2022-02-21向国家知识产权局提交的专利申请。
本一种提高图像分辨率的方法在说明书摘要公布了:本发明公开了一种提高图像分辨率的方法,包括:使用DIV2K数据集训练图像超分辨率模型;在训练完成得到最终的图像超分辨率模型之后,把需要测试的图像裁剪成96*96大小的图像块,然后依次将每个图像块输入到图像超分辨率模型中;输入图像块经过卷积神经网络浅层特征提取、Transformer块深层特征提取以及像素重组图像重建得到高分辨率输出图像块;将得到的一系列高分辨率输出图像块按照它们在输入图片中的顺序拼接起来,形成最终的高分辨率输出图像。相较现有技术,本发明中提出来的图像超分辨率模型包含更少的参数量,并且可以实现更好的图像重建效果。
本发明授权一种提高图像分辨率的方法在权利要求书中公布了:1.一种提高图像分辨率的方法,其特征在于,包括以下步骤: 步骤1,使用DIV2K数据集训练图像超分辨率模型,从DIV2K数据集中的图片上随机裁剪48*48大小的图像块作为训练数据; 步骤2,使用卷积神经网络对所述图像块进行浅层特征提取,得到特征图; 步骤3,使用Transformer块对特征图进行深层特征提取,得到新的特征图; 步骤4,使用像素重组方法对步骤3中得到的特征图进行图像重建,得到输出图像O; 步骤5,使用最小绝对值偏差损失函数计算输出图像O和高分辨率图像HR之间的差异,并使用Adam优化器进行梯度下降;重复步骤1到步骤5共50万个轮次,得到最终的图像超分辨率模型; 步骤6,测试时,把低分辨率图像分成若干个96*96大小的图像块; 步骤7,将步骤6中的图形块依次输入到步骤5中所述图像超分辨率模型中,得到高分辨率的图像块;将得到的高分辨率图像块按照其在低分辨率图像中的顺序依次拼接起来,得到最终的高分辨率图像; 其中,所述步骤3包括: 将步骤2得到的特征图F1输入到Transformer块进行深层特征提取,输出为一个新的特征图F2,其维度为[32,180,48,48];该过程包括以下步骤: 步骤3-1,输入特征图F1的维度为[32,180,48,48],使用flatten操作将其维度转换为[32,180,2304];使用transpose操作将其维度转换为[32,2304,180],操作完成之后,得到矩阵X0,该过程如下: X0=F1.flatten-2.transpose-1,-2 其中,flatten操作是把矩阵展平,transpose操作是矩阵转置; 步骤3-2,将X0输入位置编码卷积神经网络PosCNN来计算X0的位置编码,位置编码卷积神经网络使用3x3的卷积实现,该卷积的输入维度为180,输出维度为180,卷积核大小为3,边缘填充像素个数为1,步长为1,组数为180;使用位置编码卷积神经网络得到X0的位置编码pos,位置编码pos的维度也是[32,2304,180],然后将位置编码pos和X0相加,得到矩阵X1,该过程表示如下: pos=PosCNNX0 X1=X0+pos; 步骤3-3,把X1输入到Transformer块中,Transformer块一共包含36个Transformer层结构,每个Transformer层结构由2部分组成,第一部分是多头注意力方法MSA或者高效全局多头注意力方法EWMSA,第二部分是多层感知机方法MLP;按照每个TransformerLayer的序号1,2…,36,如果是奇数,则第一部分是MSA,如果是偶数,则第一部分是EWMSA;每个Transformer层结构的计算过程如下: X2=MSALNX1+X1…1或者X2=EWMSALNX1+X1…2 F2=MLPLNX2+X2…3 其中,MSA表示Multi-headSelf-Attention方法,即多头注意力方法;EWMSA表示EffectiveWide-areaMulti-headSelf-Attention方法,即高效全局多头注意力方法;LN代表LayerNorm操作,即层归一化操作;MLP代表Multi-LayerPerceptron方法,即多层感知机方法;经过Transformer块方法处理得到的新的特征图F2的维度为[32,180,48,48]; 步骤3-4,把特征图F1和F2通过残差连接相加到一起,融合特征图F1和F2的特征,得到特征图F3,该过程表示如下: F3=F1+convF2 其中,该过程中的conv表示卷积操作,该卷积的输入维度为180,输出维度为180,卷积核大小为3,边缘填充像素个数为1,步长为1。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210046 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。