首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:武汉大学

摘要:本发明公开了一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法,实现步骤如下:以现有航空影像分类数据集作为源域样本,待分类航空影像作为目标域影像,仅标注少量目标域样本;计算源域样本和目标域影像的词袋特征,用改进的粒子群优化算法对原始词袋特征进行降维,利用迭代筛选TrAdaboost动态构建训练样本集,剩余源域训练样本与待分类影像的少量样本结合构成新的训练样本集,完成源域到目标域的样本迁移,把降维后新训练样本的词袋特征投入TrAdaboost分类器训练,用训练后的分类器对目标域影像进行分类。本发明与传统的分类方法相比,具有速度快、需要标注样本较少的优点,大大节约了标注样本所需的人力和物力。

主权项:1.一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法,其特征在于,包括如下步骤:1输入源域已有标签样本其中每张样本影像的大小为m×n,Ns为源域样本的数量;2待分类目标域影像为Nt为待分类目标域影像的数量;3对所有源域样本和目标域待分类影像,输入充足的源域标签Ys和少量目标域标签Yt,Ys,Yt∈{1,2,..,k},计算其词袋特征向量Xs和Xt;4使用基于改进的粒子群优化算法对词袋特征向量Xs和Xt进行降维,得到源域和目标域降维后的特征向量XsR和XtR;5把降维后的特征向量XsR和XtR投入TrAdaboost分类器,使用改进的校正因子更新源域样本权重;6对更新后的源域样本权重设定阈值,权重低于该阈值的样本被剔出源域样本集;7重复5‑6直到没有源域样本被剔除,使用剩余源域样本和少量目标域样本训练TrAdaboost分类器;8使用训练好的TrAdaboost分类器对测试影像进行分类,得到分类标签l。

全文数据:一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法技术领域本发明属于图像处理技术领域,涉及航空图像的处理,可用于地理国情普查、土地利用调查和应急救援等方面。背景技术航空遥感技术的发展和成像设备的进步使航空遥感成像设备能够以更快的速度、更高的分辨率、更大的信息量为人类提供海量的观测数据,将人们利用航空遥感观测技术认识地物的能力带入了一个崭新的阶段。针对机载相机得到的航空影像数据,如何对其中蕴含的海量信息进行充分且有效的利用,是广大的科研工作者和技术人员挑战和机遇。航空影像的有效分类,能够更加深入的挖掘航空影像在地理国情普查、土地利用调查和应急救援等方面的应用。分类按照样本标记情况可以分为监督分类、非监督分类。非监督分类不需要人工标记样本,一般易于实现,但是由于没有样本的先验信息,分类效果通常不理想。监督分类一般是根据样本提供的先验信息进行分类,在训练样本充足的情况下能获得不错的分类效果,因此监督分类在航空图像分类中被广泛应用。一些常用的监督分类算法,如SVM算法、TrAdaboost、贝叶斯算法等在训练样本充足的情况下能获得不错的分类效果,但是标注大量样本的过程需要耗费大量人力物力且某些地区因为地理条件导致无法获取先验信息,很难标注样本。发明内容本发明的目的在于针对TrAdaboost算法在航空遥感图像中分类的缺陷,提出一种基于空间信息迁移的航空图像分类方法,通过寻找已有样本中与待分类影像相似的样本,扩充分类样本集,实现小样本的监督分类,加快分类速度,减少人工标注样本所需的时间和人力,提高分类正确率。为实现上述目的,本发明包含以下步骤:1输入源域已有标签样本其中每张样本影像的大小为m×n,Ns为源域样本的数量;2待分类目标域影像为Nt为待分类目标域影像的数量;3对所有源域样本和目标域待分类影像,输入充足的源域标签Ys和少量目标域标签Yt,Ys,Yt∈{1,2,..,k},计算其词袋特征向量Xs和Xt;4使用基于改进的粒子群优化算法对词袋特征向量Xs和Xt进行降维,得到源域和目标域降维后的特征向量XsR和XtR;5把降维后的特征向量XsR和XtR投入TrAdaboost分类器,使用改进的校正因子更新源域样本权重;6对更新后的源域样本权重设定阈值,权重低于该阈值的样本被剔出源域样本集;7重复5-6直到没有源域样本被剔除,使用剩余源域样本和少量目标域样本训练TrAdaboost分类器;8使用训练好的TrAdaboost分类器对测试影像进行分类,得到分类标签l。进一步的,步骤3中所述的对所有源域样本和目标域待分类影像,输入充足的源域标签Ys和少量目标域标签Yt,Ys,Yt∈{1,2,..,k},计算其词袋特征向量Xs和Xt,按照如下步骤进行:3a对源域和目标域所有样本影像提取尺度不变特征变换SIFT特征;3b对所有样本影像中提取的SIFT特征进行聚类,得到若干个聚类中心,每个聚类中心又叫做视觉单词;3c对目标域和源域每幅影像,把该影像中每个SIFT特征分配到最近的视觉单词,统计该影像中每个视觉单词对应的SIFT特征数量,即可得到每幅影像在视觉单词上的词袋特征向量Xs和Xt。进一步的,其中步骤4中所述的使用基于改进的粒子群优化算法对词袋特征向量Xs和Xt进行降维,得到源域和目标域降维后的特征向量XsR和XtR,按照如下步骤进行:4a假定最大迭代次数是Tmax,原始特征维度为f,降维后的特征维度为n,粒子群中粒子数量为m;4b随机生成m个粒子,每个粒子是在f维特征空间的一个特征向量,把当前位置设定为该粒子的最有位置;4c对每个粒子,计算其适应性函数其中,ε是目标域样本分类误差,λ是分类误差的权重,λ可以通过下式计算其中χ是下一次迭代相对上一次迭代目标域样本分类误差的减少值,第i个粒子的适应性值最高的位置记为适应性值最高的粒子位置记为pbest;4d使用估计不同粒子位置之间的相互关系,其中其中惯性权重ωa=μmin+μmax-μmin×rand+σ×rand,r1和r2是两个范围在0到1之间的随机数,rand是按照正态分布生成0到1的随机数;μmin,μmax和σ是人为设定的参数;和和分别代表c1,c2的初始值和最终值,t是迭代次数;4e对新的粒子位置,计算其FS,如果每个粒子的FS高于对应的则把该粒子的位置设置为同理,如果最高的FS高于pbest,则把最高的FS设为pbest;4f重复3c-3e满足直到迭代次数达到最大迭代次数;4gpbest代表了最终的最优位置,向量每一维代表了该维度的权重,选取n个权重最高的维度作为降维后的维度,把Xs和Xt映射到这些维度,得到XsR和XtR。进一步的,其中步骤5中所述的把降维后的特征向量XsR和XtR投入TrAdaboost分类器,使用校正因子更新源域样本权重,按照如下步骤进行:5a对源域和目标域训练数据集XsR和XtR,标签Ys和Yt,统计源域和目标域样本数量Ns和Nt,设置最大迭代次数为N。5b在第1次迭代中,初始归一化权重向量为5c调用传统Adaboost分类器训练源域和目标域样本得到弱分类器hx;5d计算hx在源域样本和目标域样本XsR和XtR中的分类精度5e计算5f更新样本权重其中zt是第t次迭代中被剔除的样本数量;5g重复5b-5f直到达到最大迭代次数。本发明与现有的技术相比具有以下优点:1、本发明通过引入粒子群优化方法,减少了用于分类的特征维数同时提高了特征的辨识能力,加快了分类速度加快,提高了分类的准确性。2、本发明针对航空图像分类时样本缺失的问题,利用TrAdaboost算法迁移已有的标记样本来增加标记样本,减少了人力和物力的消耗,大大的提高了分类正确率。附图说明图1是本发明的总流程图;图2是本发明所使用的已有标签数据示例图;图3是本发明中所使用航空图像的彩色图像;图4是本发明中所使用航空图像的真实标签;图5是本发明中对航空影像用TrAdaboost分类方法得到的结果;图6是本发明中用基于粒子群优化的TrAdaboost样本迁移航空影像分类方法的结果。具体实施方式参照图1,本发明基于粒子群优化的TrAdaboost样本迁移航空影像分类方法,包括如下步骤:步骤1:输入源域已有标签样本其中每张样本影像的大小为m×n,Ns为源域样本的数量。源域影像取自加利福利亚大学伯克利分校提供的UCMercedLandUseDataset,每张图像的大小为256×256,分辨率为1m,提供6类地物的样本,包括农田、森林、公路、停车场、河流和居民区,每类样本的示例如图2所示。步骤2:待分类目标域影像为Nt为待分类目标域影像的数量。目标域影像是在美国俄亥俄州蒙哥马利地区拍摄的航空影像,图像大小为150×150,分辨率为0.6m,如图3,提供6类地物的样本,包括农田、森林、公路、停车场、河流和居民区,真实标签分布如图4所示。步骤3:对所有源域样本和目标域待分类影像输入充足的源域标签Ys和少量目标域标签Yt,每类影像的源域标签应超过200张,目标域标签应少于目标域测试影像数量的10%,Ys,Yt∈{1,2,..,k},计算其词袋特征向量Xs和Xt。3a对源域和目标域所有样本影像提取尺度不变特征变换SIFT特征,每个SIFT特征是一个128维的向量。3b对所有样本影像中提取的SIFT特征进行聚类,得到若干个聚类中心,每个聚类中心也是一个128维的向量,又叫做视觉单词。3c对目标域和源域每幅影像,把该影像中每个SIFT特征分配到最近的视觉单词,统计该影像中每个视觉单词对应的SIFT特征数量,即可得到每幅影像在视觉单词上的词袋特征向量Xs和Xt。步骤4:使用基于改进的粒子群优化算法对词袋特征向量Xs和Xt进行降维,得到源域和目标域降维后的特征向量XsR和XtR。4a假定最大迭代次数是Tmax,原始特征维度为f,降维后的特征维度为n,粒子群中粒子数量为m。4b随机生成m个粒子,每个粒子是在f维特征空间的一个特征向量,把当前位置设定为该粒子的最优位置。4c对每个粒子,计算其适应性函数其中,ε是目标域样本分类误差,λ是分类误差的权重,λ可以通过下式计算其中χ是下一次迭代相对上一次迭代目标域样本分类误差的减少值。第i个粒子的适应性值最高的位置记为适应性值最高的粒子位置记为pbest。4d使用估计不同粒子位置之间的相互关系,其中其中惯性权重ωa=μmin+μmax-μmin×rand+σ×rand,r1和r2是两个范围在0到1之间的随机数,rand可以按照正态分布生成0到1的随机数;μmin,μmax和σ是人为设定的参数,μmin,μmax用来调节惯性权重在一定的范围内变化,σ用于估计惯性权重ωa和ωa的平均值之间偏离程度。和分别代表c1,c2的初始值和最终值,t是迭代次数。4e对新的粒子位置,计算其FS,如果每个粒子的FS高于对应的则把该粒子的位置设置为同理,如果最高的FS高于pbest,则把最高的FS设为pbest。4f重复4c-4e满足直到迭代次数达到最大迭代次数。4gpbest代表了最终的最优位置,向量每一维代表该维度的权重,选取n个权重最高的维度作为降维后的维度。把Xs和Xt映射到这些维度,得到XsR和XtR。步骤5:把降维后的特征向量XsR和XtR投入TrAdaboost分类器,使用改进的校正因子更新源域样本权重。5a对源域和目标域训练数据集XsR和XtR,标签Ys和Yt,统计源域和目标域样本数量Ns和Nt,设置最大迭代次数为N。5b在第1次迭代中,初始归一化权重向量为5c调用传统Adaboost分类器训练源域和目标域样本得到弱分类器hx。5d计算hx在源域样本和目标域样本XsR和XtR中的分类精度5e计算和Bt=εs+εt。5f更新样本权重其中zt是第t次迭代中被剔除的样本数量。5g重复5b-5f直到达到最大迭代次数。步骤6:对更新后的源域样本权重设定阈值,权重低于该阈值的样本被剔出源域样本集,在本次实验中,阈值设为0.2。步骤7:重复步骤5和6直到没有源域样本被剔除,使用剩余源域样本和少量目标域样本训练TrAdaboost分类器。步骤8:使用训练好的TrAdaboost分类器对测试影像进行分类,得到分类标签l。本发明的效果可以通过如下仿真实验具体说明:1、实验条件1编程实验平台为VisualStudioC++2013.2实验所用的图像是在俄亥俄州蒙哥马利拍摄的航空影像,图像的分辨率为150×150,图像如图3所示。3实验中采用分类正确率来评价分类性能,分类正确率定义为:其中correcti表示第i个真实标签Li和第i个预测标签li是否相符。2、实验结果实验1,采用TrAdaboost算法对航空图像进行分类,其分类结果如图5所示;实验2,采用本发明的方法对航空图像进行分类,其分类结果如图6所示;从图5和图6所显示的分类结果可以看出,本发明提出的基于粒子群优化的TrAdaboost样本迁移航空影像分类方法得到的结果错分点少,分类结果更好。统计TrAdaboost算法和本发明方法的分类正确率,分类正确率结果如表1所示。表12种分类方法的分类正确率统计分类方法分类准确率TrAdaboost0.8598本发明方法0.9365从表1可以看出,本发明方法比传统的TrAdaboost算法提高了7.67%,分类正确率提高明显。本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

权利要求:1.一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法,其特征在于,包括如下步骤:1输入源域已有标签样本其中每张样本影像的大小为m×n,Ns为源域样本的数量;2待分类目标域影像为Nt为待分类目标域影像的数量;3对所有源域样本和目标域待分类影像,输入充足的源域标签Ys和少量目标域标签Yt,Ys,Yt∈{1,2,..,k},计算其词袋特征向量Xs和Xt;4使用基于改进的粒子群优化算法对词袋特征向量Xs和Xt进行降维,得到源域和目标域降维后的特征向量XsR和XtR;5把降维后的特征向量XsR和XtR投入TrAdaboost分类器,使用改进的校正因子更新源域样本权重;6对更新后的源域样本权重设定阈值,权重低于该阈值的样本被剔出源域样本集;7重复5-6直到没有源域样本被剔除,使用剩余源域样本和少量目标域样本训练TrAdaboost分类器;8使用训练好的TrAdaboost分类器对测试影像进行分类,得到分类标签l。2.根据权利要求书中1所述的一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法,其特征在于:其中步骤3中所述的对所有源域样本和目标域待分类影像,输入充足的源域标签Ys和少量目标域标签Yt,Ys,Yt∈{1,2,..,k},计算其词袋特征向量Xs和Xt,按照如下步骤进行:3a对源域和目标域所有样本影像提取尺度不变特征变换SIFT特征;3b对所有样本影像中提取的SIFT特征进行聚类,得到若干个聚类中心,每个聚类中心又叫做视觉单词;3c对目标域和源域每幅影像,把该影像中每个SIFT特征分配到最近的视觉单词,统计该影像中每个视觉单词对应的SIFT特征数量,即可得到每幅影像在视觉单词上的词袋特征向量Xs和Xt。3.根据权利要求书中1所述的一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法,其特征在于:其中步骤4中所述的使用基于改进的粒子群优化算法对词袋特征向量Xs和Xt进行降维,得到源域和目标域降维后的特征向量XsR和XtR,按照如下步骤进行:4a假定最大迭代次数是Tmax,原始特征维度为f,降维后的特征维度为n,粒子群中粒子数量为m;4b随机生成m个粒子,每个粒子是在f维特征空间的一个特征向量,把当前位置设定为该粒子的最有位置;4c对每个粒子,计算其适应性函数其中,ε是目标域样本分类误差,λ是分类误差的权重,λ可以通过下式计算其中χ是下一次迭代相对上一次迭代目标域样本分类误差的减少值,第i个粒子的适应性值最高的位置记为适应性值最高的粒子位置记为pbest;4d使用估计不同粒子位置之间的相互关系,其中其中惯性权重ωa=μmin+μmax-μmin×rand+σ×rand,r1和r2是两个范围在0到1之间的随机数,rand是按照正态分布生成0到1的随机数;μmin,μmax和σ是人为设定的参数;和和分别代表c1,c2的初始值和最终值,t是迭代次数;4e对新的粒子位置,计算其FS,如果每个粒子的FS高于对应的则把该粒子的位置设置为同理,如果最高的FS高于pbest,则把最高的FS设为pbest;4f重复3c-3e满足直到迭代次数达到最大迭代次数;4gpbest代表了最终的最优位置,向量每一维代表了该维度的权重,选取n个权重最高的维度作为降维后的维度,把Xs和Xt映射到这些维度,得到XsR和XtR。4.根据权利要求书中1所述的一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法,其特征在于:其中步骤5中所述的把降维后的特征向量XsR和XtR投入TrAdaboost分类器,使用校正因子更新源域样本权重,按照如下步骤进行:5a对源域和目标域训练数据集XsR和XtR,标签Ys和Yt,统计源域和目标域样本数量Ns和Nt,设置最大迭代次数为N;5b在第1次迭代中,初始归一化权重向量为5c调用传统Adaboost分类器训练源域和目标域样本得到弱分类器hx;5d计算hx在源域样本和目标域样本XsR和XtR中的分类精度和5e计算和Bt=εs+εt;5f更新样本权重其中zt是第t次迭代中被剔除的样本数量;5g重复5b-5f直到达到最大迭代次数。

百度查询: 武汉大学 一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。