首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于知识蒸馏的跨架构视频动作识别方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华南理工大学

摘要:本发明公开了一种基于知识蒸馏的跨架构视频动作识别方法及装置,包括:选择属于不同架构的教师模型和学生模型;获取视频中的原始数据,预处理后得到用于训练的训练数据;将同一批训练数据分别传入教师模型和学生模型,提取教师模型和学生模型的中间层特征,构建互补式特征蒸馏损失;提取出教师模型和学生模型的输出层表征,构建软标签蒸馏损失;构建学生模型的分类交叉熵损失;基于三个损失训练学生模型,利用训练好的学生模型对待处理的视频动作进行识别。本发明通过互补式特征蒸馏方法,解决了传统的特征蒸馏方法在跨架构的场景中难以产生提升效果的问题,有效地实现了中间层特征知识的跨架构迁移,增强了跨架构学习的增益效果。

主权项:1.基于知识蒸馏的跨架构视频动作识别方法,其特征在于,包括下述步骤:选择属于不同架构的教师模型和学生模型;获取视频中的原始数据,并对原始数据进行预处理后得到用于训练的训练数据;将同一批训练数据分别传入教师模型和学生模型,提取教师模型和学生模型的中间层特征,构建互补式特征蒸馏损失;所述互补式特征蒸馏损失具体为:使用教师模型蒸馏学生模型时,先利用交叉注意力让教师模型融合学生模型的局部特征,得到一个具有全局和局部特征的新的教师特征,新的教师特征同时保留了自身完整的信息以及学生特征蕴含的部分关键信息,使得在特征蒸馏时,学生模型能够在学习教师模型的先进知识的同时保留住自身的优点;提取出教师模型和学生模型的输出层表征,构建软标签蒸馏损失;所述软标签蒸馏损失用于表征学生模型的预测结果与教师模型预测结果的差异;构建学生模型的分类交叉熵损失;所述分类交叉熵损失用于表征学生模型的预测结果与真实标签的差异;基于互补式特征蒸馏损失、软标签蒸馏损失和分类交叉熵损失训练学生模型,利用训练好的学生模型对待处理的视频动作进行识别。

全文数据:

权利要求:

百度查询: 华南理工大学 基于知识蒸馏的跨架构视频动作识别方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。