买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:复旦大学
摘要:本发明属于计算机图像处理技术领域,具体为基于热度图与时序注意力先验的手腕脉诊点定位方法。本发明包括:根据红外视频数据集构建寸、关、尺关键点的二维坐标作为监督信息;构建深度学习模型,具体以U‑Net为基线架构,结合时序注意力先验模块;U‑Net编码器提取输入数据的特征,解码器生成热度图,每次上采样后生成的热度图与对应层级特征进行融合,恢复到原分辨率后得到关键点热度图,最后经过关键点拟合得到关键点坐标。时序注意力先验通过跳跃连接与编码器的低级语义特征和解码器的高级语义特征进行特征融合,使模型更好地利用红外视频的时序信息,输出更精确的关键点热度图。最后预测得到手腕脉诊点的热度图,经过关键点拟合得到脉诊点坐标信息。
主权项:1.一种基于热度图与时序注意力先验的手腕脉诊点定位方法,其特征在于,具体步骤如下:1基于红外视频数据集,构建“寸、关、尺”关键点的二维坐标作为监督信息;2构建深度学习网络;所述深度学习模型以U-Net作为基线架构,结合时序注意力先验模块;其中:时序注意力先验模块中,首先计算视频中每个空间位置的灰度平均值,将视频图像集合中每帧图像减去灰度平均值并取绝对值,代表灰度值的变化程度,然后将每个空间位置的差值加起来得到空间注意力图,最后设置阈值抑制变动不大的空间位置,得到其时序注意力先验;U-Net分为收缩路径和扩张路径,由多个编码器、解码器、跳跃连接、最大池化层、转置卷积层组成;编码器负责提取输入数据的特征;解码器负责生成热度图;跳跃连接使得网络能够将高分辨率的细节信息与上采样的粗糙信息结合起来,有助于解决深度学习模型的梯度消失问题;最大池化层用于减小特征图尺寸,保留重要特征,减低计算量,减少过拟合的发生;转置卷积层用于增加特征图尺寸,进行特征图重建;每个编码器或解码器由两个3×3卷积层组成,且在每个卷积层后加入ReLU激活层和批归一化层;其中,卷积层用于提取输入数据的特征;批归一化层用于加快模型收敛的速度;ReLU激活函数层使模型具有非线性拟合能力,解决复杂的数据拟合问题;此外,在U-net跳跃连接的基础上,将时序注意力先验与编码器的低级语义特征和解码器的高级语义特征进行融合,使模型更好地利用红外视频的时序信息,输出更精准的关键点热度图;3训练深度学习网络;将采集的红外视频数据集划分为训练集、验证集、测试集;训练集用来训练深度学习模型,使其拟合数据分布;验证集用于对训练过程中的深度学习模型的泛化性做验证,记录泛化性最好的模型;测试集用于对已训练完成的深度学习模型做性能测试,以此衡量深度学习模型的性能;4利用训练完成的深度学习模型,得到关键点“寸、关、尺”的热度图;5对每个通道的关键点热度图采用圆心区域均值法进行关键点拟合,得到手腕脉诊点坐标。
全文数据:
权利要求:
百度查询: 复旦大学 一种基于热度图与时序注意力先验的手腕脉诊点定位方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。