首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深监督的实时语义分割方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:福州大学

摘要:本发明提出基于深监督的实时语义分割方法,包括以下步骤;步骤S1、针对特定的应用场景采集用于深监督的场景图像数据,构建场景图像数据库;步骤S2、对数据库中的场景图像进行像素级别标注,导出PASCALVOC格式的标注文件,使之符合语义分割任务训练要求;步骤S3、构建基于深监督的实时语义分割网络CFSegNet;步骤S4、利用已标注的数据集对CFSegNet神经网络模型进行训练;步骤S5、对应用场景中采集到的图像数据进行预处理,然后输入到CFSegNet神经网络模型,得到图像语义分割结果;本发明准确率高,时效性好,对设备计算性能要求不高,适合部署到性能受限的终端设备中。

主权项:1.基于深监督的实时语义分割方法,其特征在于:包括以下步骤;步骤S1、针对特定的应用场景采集用于深监督的场景图像数据,构建场景图像数据库;步骤S2、对数据库中的场景图像进行像素级别标注,导出PASCALVOC格式的标注文件,使之符合语义分割任务训练要求;步骤S3、构建基于深监督的实时语义分割网络CFSegNet;步骤S4、利用已标注的数据集对CFSegNet神经网络模型进行训练;步骤S5、对应用场景中采集到的图像数据进行预处理,然后输入到CFSegNet神经网络模型,得到图像语义分割结果;步骤S3具体包括以下步骤:步骤S31:采用ResNet-18作为CFSegNet的编码器,其中ResNet-18的瓶颈层对输入图像做4倍下采样,除第一阶段外,ResNet-18在后续的三个阶段中均对图像进行2倍下采样;步骤S32:ResNet-18在第一到第三阶段中,通过密集连接保存下采样阶段的表述,并引入深监督模块对编码器在第二到第四阶段输出的表述进行监督,减少编码阶段空间信息的丢失;步骤S33:将编码器第四阶段的输出结果输入到金字塔池化模块PPM中,以得到具备丰富多尺度信息的表述;步骤S34:将步骤S33得到的表述输入到级联的上采样路径中,结合步骤32的密集连接,利用通道融合模块CFM对表述进行共计3次的2倍上采样,得到融合语义信息和空间信息的表述;步骤S35:将步骤S34得到的表述通过双线性插值算法进行8倍上采样,并通过一个1×1卷积输出预测结果;步骤S4具体包括以下步骤:步骤S41:对步骤S3提出的模型进行训练,并设定初始参数如下:初始学习率,即-learningrate:0.01;权值衰减,即-weightdecay:0.0005;动量,即-momentum:0.9;训练阶段采用多项式权值衰减作为学习率衰减策略,其中最小的学习率设置为0.0001,衰减因子设置为0.9,而批大小根据应用场景中采集到的图像大小以及训练服务器显存而定;步骤S42:模型最终损失函数为: 其中Lossfinal,Lossmain,Lossaux分别代表模型的最终损失,主体损失和辅助损失,其中α为辅助损失的权重设置为0.4,K是深监督模块的数量设置为3,s为深监督模块序号;损失函数采用交叉信息熵,公式如下所示; 其中Loss代表损失值,M表示语义类别的数量,c代表像素点序号,yc是一个one-hot向量,只取两个值0和1;如果类别是与样本类别一致,则取1,否则取0,pc表示预测的像素属于类别c的概率;步骤S43:训练阶段采用随机梯度下降方法作为优化器,计算卷积神经网络更新后的权重值、偏置值;步骤S44:对部分训练样本进行随机仿射变换,并对标签文件做出相应变换,然后加入到模型的训练样本中参与训练;步骤S45:对部分训练样本进行随机位置裁剪,并对标签文件相应位置做裁剪,然后加入到模型的训练样本中参与训练;步骤S46:迭代到160000次后停止训练,保存训练好的模型。

全文数据:

权利要求:

百度查询: 福州大学 基于深监督的实时语义分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。