买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京工业大学
摘要:本发明公开了一种混合2D和3D卷积神经网络的耳部CT影像前庭分割方法,包括构建数据集、基于多种深度特征融合策略的2DCNN分割网络设计以及3DDenseUNet分割网络设计三个步骤。2D网络采用编码器‑解码器结构作为主干网络提取耳部CT影像的前庭特征;然后整合DenseNet‑BC和U‑Net网络架构,搭建一个3DDenseUNet网络,融合低层空间信息和高层语义信息,最终实现前庭的精准分割。针对前庭结构设计的分割网络可以获得比通用的分割方法更优的分割性能,提高放射科医护人员的工作效率和质量。本发明能够准确进行耳部关键结构的自动分割,帮助医生完成大量重复性的工作,有效地减轻医生的负担。
主权项:1.一种混合2D和3D卷积神经网络的耳部CT影像前庭分割方法,其特征在在于:2D网络采用编码器-解码器结构作为主干网络提取耳部CT影像的前庭特征;然后整合DenseNet-BC和U-Net网络架构,搭建一个3DDenseUNet网络,融合低层空间信息和高层语义信息,最终实现前庭的精准分割;该方法包括构建数据集、基于多种深度特征融合策略的2DCNN分割网络设计以及3DDenseUNet分割网络设计三个步骤;步骤1:构建数据集;自建前庭分割数据集,用于进行网络的训练;本发明自建了数据集VestibuleDataSet;其中的数据样本通过临床收集,包含102例、共714张正常前庭CT影像;步骤2:基于多种深度特征融合策略的2DCNN分割网络设计;采用编码器-解码器的基本架构,设计了2D前庭分割网络;通过连接和级联的方式进行编码器和解码器的特征融合,将浅层的粗略边缘定位信息与深层的细节像素分割信息融合;在编解码器的连接处和跳跃连接中加入空洞空间卷积池化金字塔ASPP,通过采用多个不同采样率的空洞卷积提取不同感受野的特征,准确挖掘到前庭不同形状和大小的信息,实现更加准确的前庭分割;步骤3:3DDenseUNet分割网络设计;基于U-Net网络架构设计了3DCNN,并且在3DCNN的编码器中采用DenseNet网络结构;DenseNet中密集连接的方式保证了每一层的输入都是先前所有层的输出;利用不同尺度的信息提取前庭的3D特征;步骤2的实施过程如下:1在下采样和上采样过程中分别采用了5层Block;2Downblock由Conv层、SEblock层、BatchNorm层、Relu层和Pooling层组成,并且在Downblock1中采用了最大池化Maxpooling,而在Downblcok2、Downblcok3和Downblcok4中采用了平均池化Averagepooling;因为在网络的浅层包含更多的无用信息,使用Maxpooling能够更好地保留边界特征信息,减少无用信息;在网络的深层更关注高级语义信息,使用Averagepooling能够保留目标周围的背景信息;3编解码器的连接采用级联操作,将底层空间信息与高层语义信息进行融合,提高分割精度;步骤3的实施过程如下:针对前庭的具体结构特点,在设计3DCNN时,通过整合DenseNet-BC和U-Net网络架构,搭建了3DDenseUNet网络;在3×3的卷积层之前使用1×1的卷积层来减少参数的数量,提高计算效率,该网络结构称为DenseNet-B;为了降低特征图的数量和实现下采样,在Denseblock之间加入转换层TransitionLayers,转换层包括Conv层和平均池化层Averagepooling,这样的网络结构称为DenseNet-C;将这两种网络结构进行结合并称其为DenseNet-BC;由于3D卷积的高内存消耗和GPU内存的限制,在DenseNet-121的基础上,将每个Denseblock中卷积层的数量缩减为原来的一半,并且设置生长速率K为32;为了减轻3DCNN的优化负担,通过加入2DCNN产生的语义信息来指导3DCNN的训练;首先训练2DCNN部分,整个训练过程的参数采用随机初始化方法;然后将2DCNN的输出8×224×224×2转换为224×224×8的3D图像,并与原始224×224×8的3D图像通过连接操作进行融合;接着将融合后的图像送入3DDenseUNet,通过固定2DCNN训练得到的模型参数,训练3DCNN部分,参数也是采用随机初始化方法,最终输出224×224×8的分割结果。
全文数据:
权利要求:
百度查询: 北京工业大学 一种混合2D和3D卷积神经网络的耳部CT影像前庭分割方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。