首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于CGLOW的全局优化的不平衡数据分类模型 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国矿业大学;江苏华深智星智能科技有限公司

摘要:本发明公开了一种基于CGLOW全局优化的不平衡数据分类模型,属于不平衡数据分类的领域。为了解决实际工业中某些类样本难以获取,造成数据不平衡影响最终分类效果的问题,我们希望以生成的方式补充少数类的样本达到样本平衡,因此我们在可逆卷积生成流模型GLOW的基础上提出了一种条件控制的GLOW,即可以根据条件来生成各种类别的样本,针对不平衡数据集使用该模型生成更多的样本补充不平衡类别的数据,在此基础上建立了一套全局优化的模型框架,以resnet作为最终的分类器,借助resnet的特征提取能力,通过最终的分类损失引导CGLOW生成质量更高的样本,在整个训练过程中对CGLOW与resnet同时进行优化,为不平衡数据分类提供了一种端到端的解决方案。

主权项:1.一种基于CGLOW全局优化的不平衡数据分类方法,其特征在于:包括以下步骤:S1:修改GLOW模型中的Z的先验分布,得到一种具有条件控制的CGLOW模型;修改GLOW模型中编码器的Z的先验分布部分的估计的具体过程如下:将GLOW中原有的多维标准正态分布,进行修改,修改后的Z的先验分布概率密度函数为如下公式: 其中l是离散的变量,表示类别信息,μ是均值,σ是方差;S2:对带有标签的不平衡图像数据集进行简单的预先增广,对带有标签的不平衡图像数据集进行预先增广的方式包括归一化、平移、缩放和加入噪声;使用正向CGLOW模型作为编码器,将预处理后的数据集成分批次的样本输入编码器进行计算,得到编码器的损失函数值和n个类别的均值和方差向量;计算编码器的损失函数的具体过程如下:原模型的损失函数如下: 使用最大似然做拟合修改Z的先验分布,得到的loss_logP为: 得到编码器的损失函数如下:lossMLE=loss_logdet+loss_logP上式中,loss_logdet是原有的损失函数,loss_logP是新增的损失函数;S3:依据编码器的损失函数,利用梯度下降算法计算梯度信息,当梯度反传时更新编码器的内部参数,对CGLOW进行一次优化;S4:利用不同类别的均值和方差进行重采样,得到每个类别对应的隐变量z,将逆向的CGLOW模型作为解码器,将隐变量z输入到解码器中,得到各类数量平衡的生成样本;S5:将生成样本输入分类器resnet中进行分类,得到分类结果,计算分类器的损失函数,当梯度反向传播的时候,梯度信息从分类器resnet传输到解码器中,由此完成一次分类器参数的更新和解码器的参数更新,实现对分类器的第一次优化和对CGLOW的第二次优化;计算生成样本分类损失函数的过程如下:生成样本输入resnet中进行分类,计算这个批量的分类损失,在这一过程中计算的交叉熵损失的公式如下: 上式中,n表示的是一个批量的样本数,yi是每个样本的独热编码向量,是模型输出对应的每个样本的输出向量;S6:当CGLOW的损失函数值不再下降时,分类模型训练完成。

全文数据:

权利要求:

百度查询: 中国矿业大学 江苏华深智星智能科技有限公司 一种基于CGLOW的全局优化的不平衡数据分类模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术