恭喜华南师范大学余松森获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜华南师范大学申请的专利一种细粒度图像分类方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114692750B 。
龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210318057.0,技术领域涉及:G06V10/764;该发明授权一种细粒度图像分类方法、装置、电子设备及存储介质是由余松森;陈建华;梁军;黄志机;朱海文设计研发完成,并于2022-03-29向国家知识产权局提交的专利申请。
本一种细粒度图像分类方法、装置、电子设备及存储介质在说明书摘要公布了:本发明涉及一种细粒度图像分类方法、装置、电子设备及存储介质。本发明所述的细粒度图像分类方法包括:获取待分类的图像;将所述待分类的图像输入训练好的特征提取网络,得到所述图像的多尺度特征;其中,所述特征提取网络为插入了PCFN模块的ResNet101神经网络;将所述图像的多尺度特征输入分类网络,得到所述待分类图像的细粒度分类结果。本发明所述的一种细粒度图像分类方法,通过关联跨层特征来学习更多的鉴别性特征,结合不同层特征的特性,得到更具表达能力的多尺度特征,提高分类效果。
本发明授权一种细粒度图像分类方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种细粒度图像分类方法,其特征在于,包括以下步骤:获取待分类的图像;将所述待分类的图像输入训练好的特征提取网络,得到所述图像的多尺度特征;其中,所述特征提取网络为插入了PCFN模块的ResNet101神经网络;将所述图像的多尺度特征输入分类网络,得到所述待分类图像的细粒度分类结果;将所述图像输入训练好的特征提取网络,得到所述图像的多尺度特征,包括:将所述图像输入Resnet101神经网络的第一层,并顺次输入layer1、layer2、layer3、layer4进行卷积处理;将layer2和layer3的输出特征分别输入其后的PCFN模块,得到语义加权后的输出特征;将所述layer2和layer3的语义加权后的输出特征分别输入到维度变换模块,得到和layer4的输出特征空间维度和通道维度一致的输出特征;将所述维度变换模块的输出特征和layer4的输出特征进行特征融合,得到所述图像的多尺度特征;将layer2和layer3的输出特征分别输入其后的PCFN模块,得到语义加权后的输出特征,包括:针对所述layer2和layer3的输出特征中的任一个,将该输出特征输入所述PCFN模块的通道关联分支和空间关联分支,作为所述PCFN模块的响应层;对所述layer4的输出特征进行上采样操作,输入所述PCFN模块的通道关联分支和空间关联分支,作为所述PCFN模块的查询层;在所述通道关联分支和所述空间关联分支进行加权操作,得到所述layer4的输出特征对所述layer2和layer3的输出特征中的任一个的输出特征在通道和空间两个维度的语义加权信息;输出所述加权信息,得到所述layer2和layer3的输出特征中的任一个所对应的语义加权后的输出特征;将所述维度变换模块的输出特征和layer4的输出特征进行特征融合,包括:将所述维度变换模块的输出特征和layer4的输出特征以element-wiseadd方式进行特征融合;PCFN采用如下方法得到语义增强的特征进行运算:PCFN有两个输入源,分别为高低层特征;高层特征表示为底层特征表示为PCFN的输出特征Xp为:Xp=Zch+Zsp=AchXq,Xr⊙chXr+AspXq,Xr⊙spXr其中:AchXq,Xr=FSG[Wz|θσ1WvXr×FSMσ2WqFUSXq] 式中,Wq、Wv和Wz分别为1×1卷积层,σ1、σ2、σ3是为张量重塑算子;FSM·是SoftMax算子,“×”是矩阵点积运算;FUS为Xq为了得到与Xr相同空间维度的进行的上采样操作;FGP·是一个全局池运算符,“×”是矩阵的点积运算;FSG·为Sigmoid函数;AchXq,Xr为关联查询层和响应层的通道操作,得到通道语义增强的权重;⊙ch是一个通道级乘法运算符;AchXq,Xr⊙chXr用于得到对通道语义增强的浅层特征;AspXq,Xr为关联查询层和响应层的空间操作,AspXq,Xr⊙spXr用于得到空间语义增强的浅层特征;步骤3,将步骤2的语义加权后输出特征输入PCFN模块其后的维度变换模块,以得到和layer4的输出特征空间和通道维度一致的输出特征;步骤4,将步骤3的进行维度变化操作后的输出特征和layer4输出特征通过element-wiseadd方式进行特征融合;PCFNbiXq,Xr=Xq+WzFMPXp+WdXp2Xp相为响应层在通道和空间关联查询层后的特征;FMP·和WZ符为对关联查询层特征后的响应层特征进行空间降维以及之后的通道升维操作;空间降维采用了最大池化,可以获取到经过查询层语义加权后的响应层特征的关键信息,为了避免忽略局部上下文信息,还通过逐通道卷积Wd拿到局部上下文信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南师范大学,其通讯地址为:528225 广东省佛山市南海区狮山南海软件园华南师范大学软件学院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。