首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于课程学习的图像分类的增量学习方法_西北工业大学_202410254888.5 

申请/专利权人:西北工业大学

申请日:2024-03-06

公开(公告)日:2024-06-21

公开(公告)号:CN118230028A

主分类号:G06V10/764

分类号:G06V10/764;G06V10/774;G06V10/77;G06V10/778

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:本发明提供了一种基于课程学习的图像分类的增量学习方法。首先,利用现有图像数据集构建训练数据集,然后,通过输入图片旋转方式训练初始化网络模型,拓展网络分类问题;最后,采用基于课程学习的增量式学习方式迭代训练网络,得到最终的图像分类网络模型。本发明能够缓解图像分类增量学习的“灾难性遗忘”问题,提在减小遗忘率的同时,实现更好的网络可塑性‑稳定性的平衡。

主权项:1.一种基于课程学习的图像分类的增量学习方法,其特征在于步骤如下:步骤1,构建训练数据集:将CIFAR100数据集划分为6个子数据集,其中一个子数据集包含50个类别的图片,记为D0,其它5个子数据集Di各包含10个类别的图片,i=1,…,5;步骤2,训练初始化模型:利用步骤1获得的数据集D0训练网络,训练时,设置网络的损失函数为分类损失,并将输入图片分别旋转90°、180°、270°后全部输入;所述的网络包括特征提取器和分类器两部分,分类损失的计算公式如下: 其中,Lclf表示分类损失,B为训练的batchsize,L·表示计算交叉熵损失,Xi表示第i张图片,Yi表示第i张图片的标签,表示特征提取器的输出,表示分类器的输出,τ为温度系数,可设置的取值范围为0.05~0.2;步骤3,增量式学习优化网络模型:采用基于课程学习的增量式学习方式迭代训练网络模型,直至模型收敛,得到最终的图像分类网络;其中,每次训练时由特征提取器和上一次训练好的网络的分类器构成待训练的网络,第一次训练时采用步骤2训练好的网络的分类器;所述的采用基于课程学习的增量式学习方式训练网络的具体过程如下:第t次训练时,将数据集Dt输入到待训练的网络,由其中的特征提取器提取得到其特征,记为由上一次训练好的网络的特征提取器提取数据集Dt-1的特征,记为|Cold|表示旧类别个数,按以下公式计算混合特征Fold: 其中,β表示新数据特征与旧类中心的加权值,取值为[0,0.6]的随机值;pe是[0,0.1]的随机值,n的取值为1,2,…B,m的取值为1,2,…|Cold|;然后,将混合特征Fold输入到网络的分类器,按下式计算旧类特征分类损失: 其中,Lproto表示旧类特征分类损失,表示混合特征Fold中的第i个特征,表示第t次训练时的分类器操作,Yi表示第i个特征的标签,与Pold中的第i个特征的标签一样;修改分类器,增加用于对新类别进行分类部分,然后设置warmup损失为Lnew_cls=Lclf+λ*Lproto来优化分类器,λ取值为10;利用当前网络对数据集Dt进行处理得到预测的分类概率,然后计算新类别的分类准确率acci,按照为每一类计算一个自适应阈值ηi,其中η0是一个固定值,取值为30,acci为第i个类别的分类准确率;i=1,2,…,|Cnew|,|Cnew|表示新类别个数;按照公式1计算数据集Dt中每个样本的分类损失,将每个样本的分类损失与其所属类别的阈值进行比较,分类损失小于阈值的样本作为容易样本;利用当前网络的特征提取器提取由容易样本构成的数据集的类中心Pnew,Pnew和Pold组成prototype分类器其中,pi表示prototype分类器的第i个权重,i=1,…,|Cold|+|Cnew|;将容易样本输入到当前网络中进行训练,训练时设定网络总损失如下:Ltotal=Lclf+α*LKD+λ*Lproto+γ*Lprocls4其中,Ltotal表示网络总损失,Lclf表示按照公式1计算的分类损失,LKD表示蒸馏损失,Lproto表示按照公式3计算的旧类特征分类损失,Lprocls表示prototype分类器损失,α表示蒸馏损失的系数,取值为10;λ表示旧类特征分类损失的系数,可设置的取值范围为1~15;γ表示prototype分类器损失,取值为0.1;所述的蒸馏损失LKD和prototype分类器损失Lprocls的计算公式分别如下:LKD=||Ft-Ft-1||5 其中,Ft表示利用当前网络的特征提取器提取得到的容易样本的特征,Ft-1表示利用上一时刻网络的特征提取器提取得到的容易样本的特征;fi表示Ft中的第i个特征;pj表示prototype分类器的第j个权重;yi表示特征fi对应的类别;重复上述过程进行迭代训练。

全文数据:

权利要求:

百度查询: 西北工业大学 一种基于课程学习的图像分类的增量学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。