买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:复旦大学
摘要:本发明属于计算机图像处理技术领域,具体为基于红外视频与深度学习的手腕脉诊点定位方法。本发明的基本步骤为:数据集中的每个红外视频皆有“寸、关、尺“的二维坐标作为深度学习模型的监督信息。深度学习模型以ResNet‑18作为基线架构,并将ResNet‑18中的二维卷积层、二维最大池化层、二维批归一化层等,以三维卷积层、三维最大池化层、三维批归一化层等作置换。ResNet‑18中每个残差模块结合基于LSTM的时序注意力模块,以特征图作为输入,并输出时序轴的注意力权重分布,让模型专注于信息量较多的特征图,更好地捕捉红外视频的时序信息。最后将待测定的手腕红外视频作为已训练完成的深度学习模型的输入,预测得到手腕脉诊点的坐标。
主权项:1.一种基于红外视频与深度学习的手腕脉诊点定位方法,其特征在于,具体步骤如下:1采集红外视频数据集,构建“寸、关、尺”关键点的二维坐标,作为监督信息;2构建深度学习网络;所述深度学习模型以ResNet-18作为基线架构,并将ResNet-18中的二维卷积层、二维最大池化层、二维批归一化层置换为三维卷积层、三维最大池化层、三维批归一化层;ResNet-18由多个残差模块与最大池化层所组成;残差模块用于提取数据的特征,最大池化层用于降低特征图大小,使模型的参数量维持在硬件所能负载的范围内,降低过拟合的现象发生;每个残差模块由两个3×3卷积层与跳跃连接支路所组成,且在每个卷积层后加入批归一化层与ReLU激活函数层;其中,卷积层用于提取手腕视频数据的特征;跳跃连接用于解决深度学习模型的梯度消失问题;批归一化层用于加快模型收敛的速度;ReLU激活函数层用于让模型具有非线性拟合能力,解决复杂的数据拟合问题;在残差模块的基础上,使用时序注意力模块,使模型专注于信息重要的视频帧上;具体地,将时序注意力模块的输出与残差模块中第二个卷积层的特征图做相乘;所述时序注意力模块由展平层、LSTM层、Sigmoid激活函数层所组成,展平层用于将输入特征图展平为一维向量,作为LSTM层的输入;LSTM层用于提取输入向量的特征,并建模输入向量中的时序关系;Sigmoid激活函数层用于将LSTM层的输出转换为概率分布;3训练深度学习网络;将采集的红外视频数据集划分为训练集、验证集、测试集;训练集用来训练深度学习模型,使其拟合数据分布;验证集用于对训练过程中的深度学习模型的泛化性做验证,记录泛化性最好的模型;测试集用于对已训练完成的深度学习模型做性能测试,以此衡量深度学习模型的性能;4利用训练完成的深度学习模型,直接回归出“寸、关、尺”关键点在视频中的位置。
全文数据:
权利要求:
百度查询: 复旦大学 一种基于红外视频与深度学习的手腕脉诊点定位方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。