恭喜哈尔滨工业大学(威海);南京龙垣信息科技有限公司丁建睿获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜哈尔滨工业大学(威海);南京龙垣信息科技有限公司申请的专利基于多视图知识蒸馏的图像识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119068306B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411087561.X,技术领域涉及:G06V10/82;该发明授权基于多视图知识蒸馏的图像识别方法是由丁建睿;刘家栋;丁卓设计研发完成,并于2024-08-09向国家知识产权局提交的专利申请。
本基于多视图知识蒸馏的图像识别方法在说明书摘要公布了:本发明涉及数据处理技术领域,具体涉及一种基于多视图知识蒸馏的图像识别方法,包括:通过成像设备获取单一目标在不同视角下的多个成像视图;教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取;将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合;利用融合后的特征向量预测目标在单视角和多视角下的类别概率并使用真实标签进行监督;学生模型对多个视图分别进行原型特征提取;利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型;解决了现阶段多视图识别模型参数量大、训练和推理成本较高、推理速度慢的问题。
本发明授权基于多视图知识蒸馏的图像识别方法在权利要求书中公布了:1.一种基于多视图知识蒸馏的图像识别方法,其特征在于,包括:通过成像设备获取单一目标在不同视角下的多个成像视图;教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取;将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合;利用融合后的特征向量预测目标在单视角和多视角下的类别概率并使用真实标签进行监督;学生模型对多个视图分别进行原型特征提取,生成基于原型的多视图特征向量进行跨视图联合预测得到单视角及多视角下的学生网络预测概率;利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型;所述教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取的具体步骤包括:对所述多视图进行步长为4的覆盖卷积,利用尺寸大于步长的扩张卷积核对图像块的特征进行映射,实现对每个图像块与相应邻接特征关联性的提取,生成映射特征;对所述映射特征按照空间位置排列为H×W×C的特征向量输入到多阶段的卷积分支,对所述映射特征按顺序排列成N个单维特征组成的特征序列输入到多阶段的注意力分支,进行并行特征提取,提取出的并行特征表示为:Fc=CNNRPatchFFa=AttentionPatchF其中Fc表示CNN分支的输出特征,Fa表示Attention分支的输出特征,F表示图像的输入特征,R表示reshape操作,Patch表示覆盖卷积进行的图像块特征映射;所述将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合的具体步骤包括:将来自双分支的并行特征向量2×3×C进行通道维度拼接并输入到全连接层中预测w1和w2,利用w1和w2为加权值进行对位融合计算表示为F=w1Fc+w2Fa;所述利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型的具体步骤包括:所述教师预测标签由教师模型的预测概率经过数据增强得到,令表示教师模型的输出,则在蒸馏温度系数为τ时,教师的预测结果的定义为:将真实标签做为硬标签,将教师网络预测的标签做为软标签,利用单视图标签和多视图综合标签对学生网络进行双监督训练,多视图知识蒸馏的损失定义为: 其中N为视图的数量,α、β、c1、c2为可调节参数,为第i个单视图标签与其软标签的余弦相似度损失,为第i个单视图标签与其硬标签的余弦相似度损失;通过知识蒸馏提高学生模型的识别精度,得到可以部署到边缘设备的精简模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(威海);南京龙垣信息科技有限公司,其通讯地址为:264200 山东省威海市文化西路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。