首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于条件对抗自动编码机的广义零样本图像识别方法_大连理工大学人工智能大连研究院;大连钜智信息科技有限公司_202011512678.X 

申请/专利权人:大连理工大学人工智能大连研究院;大连钜智信息科技有限公司

申请日:2020-12-20

公开(公告)日:2024-06-14

公开(公告)号:CN112580722B

主分类号:G06V10/764

分类号:G06V10/764;G06V10/774;G06V10/82;G06N3/0455;G06N3/0475;G06N3/094

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2021.04.16#实质审查的生效;2021.03.30#公开

摘要:本发明涉及一种零样本图像识别方法,尤其涉及一种基于条件对抗自动编码机的广义零样本图像识别方法。一种基于条件对抗自动编码机的广义零样本图像识别方法,所述的广义零样本识别方法采用条件对抗自动编码机中的解码器结合先验分布和类别属性条件生成伪样本,解决零样本问题。本发明的有益效果是:采样条件对抗自动编码机,将数据潜在语义表示的集成后验分布匹配为一个先验分布,如标准正态分布,提高了生成模型的稳定性;将类别属性作为条件训练对抗自动编码机,提高了模型的判别能力,生成的伪样本更接近数据的真实分布;同时生成可见类和不可见类的伪样本,仅使用伪样本训练SVM分类器以消除数据不平衡的影响。

主权项:1.一种基于条件对抗自动编码机的广义零样本图像识别方法,其特征在于所述的条件对抗自动编码机采用对抗训练模式,同时生成可见类和不可见类伪样本,包括以下步骤:步骤1,构建一个编码器,以图像视觉特征和对应的类别属性串联作为输入,编码成潜在语义表示后输出;具体为编码图像视觉特征和类别属性为潜在语义表示:编码器定义为概率模型,采用前向神经网络实现,通过该网络,图像的视觉特征和对应类别属性的串联数据将被编码成潜在表示,为了能够采用已知分布生成伪样本,将潜在表示强制匹配为一个先验分布;步骤2,构建一个解码器,以步骤1中的潜在语义表示和对应的类别属性串联作为输入,解码重构出图像视觉特征,计算重构损失;具体为解码潜在语义表示和类别属性为重构的图像视觉特征:解码器用于从潜在表示和它对应的类别属性重构出输入的,定义为一个深度网络,网络参数为,输出为,即的重构,解码器在整个对抗自动编码机训练完毕之后将扮演生成器的角色,从已知的分布中采样噪声数据,串联上条件数据,生成训练需要的伪样本数据,训练解码器采用范数平方构建的重构损失如公式1所示: ;步骤3,构建一个判别器,通过对抗训练,将数据潜在语义表示的集成后验分布匹配为一个先验分布,从先验分布随机采样的数据为真,潜在语义表示数据为假;步骤4,构建和优化总目标函数,迭代更新模型的参数,保存解码器模型;步骤5,采用解码器,串联先验分布的随机采样数据和可见类或不可见类的类别属性,输入到解码器,生成类别对应的伪样本,有监督训练分类器SVM;步骤6,广义零样本图像识别学习,输入图像视觉特征,SVM分类结果为识别结果。

全文数据:

权利要求:

百度查询: 大连理工大学人工智能大连研究院;大连钜智信息科技有限公司 一种基于条件对抗自动编码机的广义零样本图像识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。