Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京航空航天大学胥帅获国家专利权

南京航空航天大学胥帅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京航空航天大学申请的专利一种基于层次特征融合的组合式零样本图像分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119478551B

龙图腾网通过国家知识产权局官网在2025-06-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510005907.5,技术领域涉及:G06V10/764;该发明授权一种基于层次特征融合的组合式零样本图像分类方法是由胥帅;王越;刘莹;仇藻设计研发完成,并于2025-01-03向国家知识产权局提交的专利申请。

一种基于层次特征融合的组合式零样本图像分类方法在说明书摘要公布了:本发明属于计算机视觉与人工智能技术领域,公开了一种基于层次特征融合的组合式零样本图像分类方法。本发明方法针对组合式零样本图像分类的技术难点,创新性地提出了基于层次特征融合的解决方案。通过选取CLIP模型视觉编码器中不同深度的特征,并对其进行层次融合,有效提取多层次、多尺度的视觉信息,融合后的特征进一步用于视觉与语义的跨模态交互,显著提升了模型对复杂组合的理解能力。此外,本发明通过引入特定损失项,有效分离属性和对象特征,避免特征混叠问题。在组合式零样本图像分类任务中,本发明方法展现出优异的泛化能力和识别效果,能够显著提升模型对未知复杂组合图像的分类性能。

本发明授权一种基于层次特征融合的组合式零样本图像分类方法在权利要求书中公布了:1.一种基于层次特征融合的组合式零样本图像分类方法,其特征在于,包括如下步骤: 步骤1.搭建基于层次特征融合的组合式零样本图像分类模型,包括CLIP文本编码器、CLIP视觉编码器、多层视觉特征融合模块、跨模态交互模块、解耦模块以及损失计算模块; 步骤2.针对属性、对象和组合,生成各自的初步嵌入表示即词嵌入,初步嵌入表示将作为参数在反向传播的过程中进行更新;将属性、对象、组合的初步嵌入表示与提示前缀嵌入相结合,通过预训练的CLIP文本编码器获取属性、对象、组合的文本特征; 步骤3.将训练集中的图像作为输入图像传入CLIP视觉编码器,逐层处理图像的特征,从CLIP视觉编码器中提取出不同层次的特征; 步骤4.从CLIP视觉编码器中筛选出初始层特征、中间层特征以及最终层特征,并通过多层视觉特征融合模块计算出不同层次特征的权重即加权系数,对不同层次的特征进行加权组合,构造视觉融合特征; 步骤5.将步骤2获得的文本特征与步骤4构造的视觉融合特征输入至跨模态交互模块,通过交叉注意力机制,实现视觉融合特征和文本特征的深度融合,得到优化后的属性、对象、组合的文本特征; 步骤6.对CLIP视觉编码器最后一层输出的图像特征进行解耦,解耦模块采用三个可训练的多层感知器MLP分别从CLIP视觉编码器最后一层输出的图像特征中提取属性视觉特征、对象视觉特征和组合视觉特征; 步骤7.损失计算模块将步骤6解耦后得到的属性、对象、组合的视觉特征与步骤5所获取的优化后的属性、对象、组合的文本特征分别利用余弦相似度进行相似度计算,得出预测值,并通过分类损失函数衡量预测值与真实标签之间的差异形成各分支损失,同时引入协方差损失项以优化解耦效果,并通过加权求和得到总损失; 步骤8.通过总损失的反向传播机制,对多层视觉特征融合模块的加权系数、用于解耦的MLP的参数以及属性、对象、组合的初步嵌入表示进行联合更新; 步骤9.重复执行步骤3至步骤8,并将每次迭代后的基于层次特征融合的组合式零样本图像分类模型在验证集上进行评估,直至损失函数收敛,根据验证集结果得到训练好的基于层次特征融合的组合式零样本图像分类模型和优化后的属性、对象、组合的嵌入表示; 步骤10.利用训练好的基于层次特征融合的组合式零样本图像分类模型对输入图像进行分类。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市江宁区将军大道29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。