恭喜南京信息工程大学曹小玲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京信息工程大学申请的专利一种基于表征批归一化的自然场景文本识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114219990B 。
龙图腾网通过国家知识产权局官网在2025-03-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111441046.3,技术领域涉及:G06V20/62;该发明授权一种基于表征批归一化的自然场景文本识别方法是由曹小玲;孙亚杰;孙莹莹设计研发完成,并于2021-11-30向国家知识产权局提交的专利申请。
本一种基于表征批归一化的自然场景文本识别方法在说明书摘要公布了:本发明公开了一种基于表征批归一化的自然场景文本识别方法,包括:利用空间转换网络将文本图像规则化为水平文本图像;对现有网络ResNet‑50中引入表征归一化,构建得到特征提取网络;利用所述特征提取网络对水平文本图像进行提取,得到若干个不同分辨率大小的视觉特征图,组成特征金字塔Fr;通过特征增强网络对特征金字塔Fr进行特征提取,并将提取得到的不同尺寸的特征图进行融合,得到相同尺寸大小的特征图;利用视觉‑语义联合网络提取特征图的语义信息,把提取出的语义信息和视觉特征相融合,得到一个新的特征空间;利用解码器对特征空间进行预测,得到最终识别结果。本发明可以提高场景文本识别的准确率,并提升模型的泛化力。
本发明授权一种基于表征批归一化的自然场景文本识别方法在权利要求书中公布了:1.一种基于表征批归一化的自然场景文本识别方法,其特征在于,具体包括如下步骤:步骤1,利用空间转换网络将待识别的自然场景文本图像规则化为水平文本图像;步骤2,对现有网络ResNet-50中引入表征批归一化,构建得到特征提取网络;利用所述特征提取网络对所述水平文本图像进行提取,得到若干个不同分辨率大小的视觉特征图;所述若干个不同分辨率大小的视觉特征图组成特征金字塔Fr;步骤3,通过特征增强网络对所述特征金字塔Fr进行上尺度增强和下尺度增强,并与步骤2所述特征金字塔Fr的元素进行连接,获得最终的特征金字塔Fe,对特征金字塔Fe中各特征图进行上采样,得到相同尺寸大小的特征图Ff;步骤4,利用视觉-语义联合网络提取步骤3所述特征图Ff的语义信息,把提取出的语义信息和特征图相融合,得到一个新的特征空间;步骤5,利用解码器对步骤4所述特征空间进行预测,得到最终识别结果;步骤2所述表征批归一化,具体表示如下:给定特征图X∈RA×B×H×W,其中,A、B、H和W分别表示批量大小、通道数、特征图的高度值和宽度值;首先,对特征图X执行校准操作,得到校准后的特征图Xcm,表示如下:Xcm=X+ωm.Km式中,ωm表示权重值,Km表示特征图X的统计数据;然后,对特征图Xcm执行中心化操作,得到中心化后的特征图Xm,表示如下:Xm=Xcm-EXcm式中,EXcm表示特征图Xcm的均值,表示如下:EXcm←mEXcm+1-mμc式中,m表示累计相加量,←表示函数映射,μc代表训练时每个批量的均值,表示如下; 式中,h表示特征图X的高度值,w表示特征图X的宽度值;接着,对特征图Xm执行缩放操作,得到缩放后的特征图Xs,表示如下: 式中,∈用于避免零方差,Var表示方差函数,表达式如下; 式中,表示训练时每个批量的方差,表示如下: 其次,对特征图Xs进行缩放校正特征强度,得到校正后的特征图Xcs,表示如下:Xcs=Xs·Rωv·Ks+ωb式中,ωv和ωb表示可训练参数,Ks表示特征图Xs的统计数据;R表示校正函数;最后,将校正后的特征图Xcs进行仿射变换,得到放射变换后的特征Y,表达式如下:Y=Xcsγ+β式中,γ为缩放参数,β为平移参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:224002 江苏省盐城市盐南高新区新河街道文港南路105号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。