首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种半监督动物三维姿态估计方法、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国地质大学(武汉)

摘要:本发明提供了一种半监督动物三维姿态估计方法、设备及存储介质,涉及视频图像处理技术领域,其方法包括:搭建多视图拍摄平台,由多视图拍摄平台拍摄获取动物视频、将动物视频进行数据集划分,并标记训练集中数据、建立具有时空约束的半监督动物三维姿态估计模型,使用训练集训练获取初始模型、使用初始模型对测试集进行姿态预测,基于时空约束条件优化模型性能获取最终的半监督动物三维姿态估计模、将待预测视频输入最终的半监督动物三维姿态估计模型,获取三维姿态估计结果设备及存储介质,用于实现方法;本发明的有益效果是:具有更高的准确性、更好的泛化能力,数据标注成本更低。

主权项:1.一种半监督动物三维姿态估计方法,其特征在于,具体步骤包括:S1、搭建多视图拍摄平台,由多视图拍摄平台拍摄获取动物视频;S2、将动物视频进行数据集划分,并标记训练集中数据;所述数据集划分的具体过程为:将多视图拍摄平台同一时间拍摄获取的动物视频中所有视角的2D视频帧集合组成动物的3D视频帧,以3D视频帧为最小单位将动物视频划分为训练集和测试集;S3、建立具有时空约束的半监督动物三维姿态估计模型,使用训练集训练获取初始模型;所述具有时空约束的半监督动物三维姿态估计模型由多视图体积三维姿态估计网络和无监督的时间与空间约束框架两个部分组成;所述多视图体积三维姿态估计网络是3D卷积神经网络,工作过程为:S31、以3D视频帧为处理单元,使用标准2DUNet检测出单个3D视频帧中所有2D视频帧中的动物2D质心,通过三角测量结合动物2D质心得出该3D视频帧的3D质心;S32、以3D质心作为为视频帧中动物体积的集中点,结合相机位置关系与3D质心获取动物的3D体积框架;S33、将动物的3D体积框架输入3D卷积神经网络,获取预测的3D坐标;所述时间与空间约束框架根据半监督的时间平滑度约束和空间距离约束构建;所述时间平滑度约束的对象为同一关键点的相邻帧,函数表达式如下: 其中,表示时间约束函数;为训练集中3D视频帧的帧数;表示关键点的数量;表示标记的3D视频帧,表示被标记的第帧,表示被标记帧中的关键点序号;表示关键点的三维坐标;所述空间距离约束的对象为同一视频帧中不同的关键点,函数表达式如下: 其中,表示空间距离约束函数;为距离权重因子,为取最大值函数;r为关键点i与关键点j的实际距离;S4、使用初始模型对测试集进行姿态预测,基于时空约束条件优化模型性能获取最终的半监督动物三维姿态估计模型;S5、将待预测视频输入最终的半监督动物三维姿态估计模型,获取三维姿态估计结果。

全文数据:

权利要求:

百度查询: 中国地质大学(武汉) 一种半监督动物三维姿态估计方法、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。