首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种用于组合零次学习的视觉属性表征学习方法_贵州大学_202410613151.8 

申请/专利权人:贵州大学

申请日:2024-05-17

公开(公告)日:2024-06-14

公开(公告)号:CN118196428A

主分类号:G06V10/42

分类号:G06V10/42;G06V10/764;G06V10/86;G06V10/82;G06V10/776;G06N3/045;G06N3/08

优先权:

专利状态码:在审-公开

法律状态:2024.06.14#公开

摘要:本发明公开了一种用于组合零次学习的视觉属性表征学习方法,包括以下步骤:S1,将训练集图片输入LVAR‑CZSL的视觉骨干网络提取图片全局视觉特征,然后通过视觉属性表征模块(VARM)进一步提取更细致的属性和对象视觉特征;S2,将文本信息通过预训练的词嵌入模型转化为词向量,输入LVAR‑CZSL模型中的联系性学习模块(CLM),得到具有全局依赖性的属性和对象文本特征;S3,通过LVAR‑CZSL模型中的联合评分函数(JSF)结合视觉特征和文本特征,缩小图像和文本特征之间的距离,联合损失函数(JLF)优化VARM和CLM的学习过程,得到训练完毕的LVAR‑CZSL模型;S4,将待预测测的图像或者待检索的文本输入LVAR‑CZSL模型,得到测试结果。

主权项:1.一种用于组合零次学习的视觉属性表征学习方法,其特征在于,包括以下步骤:S1,将训练集图片输入用于组合零次学习的视觉属性表征学习LVAR-CZSL模型的视觉骨干网络提取图片全局视觉特征,然后通过视觉属性表征模块VARM提取属性和对象视觉特征:和;S2,将文本信息通过预训练的词嵌入模型转化为词向量,输入用于组合零次学习的视觉属性表征学习LVAR-CZSL模型中的联系性学习模块CLM进行特征学习,得到具有全局依赖性的属性和对象文本特征;S3,对步骤S1中的视觉特征以及步骤S2中的文本特征进行兼容性评分,缩小图像和文本特征之间的距离,优化视觉属性表征模块VARM和联系性学习模块CLM的学习过程,得到训练完毕的用于组合零次学习的视觉属性表征学习LVAR-CZSL模型;S4,将待预测的图像或者待检索的文本输入到训练完毕的用于组合零次学习的视觉属性表征学习LVAR-CZSL模型,得到测试结果。

全文数据:

权利要求:

百度查询: 贵州大学 一种用于组合零次学习的视觉属性表征学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。