买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华中师范大学
摘要:本发明属于人工智能技术领域,公开了一种基于不同呈现方式的教学视频自动化分类方法及系统,以三个卷积神经网络模型,通过自训练的两个YOLOV4目标检测神经网络模型和人体关键点检测技术可以准确的定位教学视频分类所需要的信息,解决了教学视频背景和人物特征改变不明显的问题,增加了特征提取的准确度。自建的卷积神经网络模型的结构适合进行Interview型和Head型两种教学视频分类,网络深度对比经典的几种视频分类算法来说刚好合适,减少了计算机硬件耗能。使用其它相关的图像数据集预处理后作为所需的训练集,突破了教学视频数据集上的瓶颈。提供了一种新的教学视频分类方式,提高了教学视频分类的正确率和效率。
主权项:1.一种基于不同呈现方式的教学视频自动化分类方法,其特征在于,所述基于不同呈现方式的教学视频自动化分类方法包括:使用自训练的YOLOV4目标检测网络模型1提取视频关键帧中的教室特征,通过输出的教室特征判断视频是否为课堂实录型;通过自训练的YOLOV4目标检测网络模型2输出的信息判断是否为单纯PPT类型;根据人体关键点检测区分PPT加教师形象型和演播室录播型;使用自建的卷积神经网络模型区分interview型head型两种视频特征;基于不同呈现方式的教学视频自动化分类系统包括:自训练的YOLOV4目标检测网络模型1单元:使用收集到的有教室特征的大量图像作为数据集,将每一张图片上面标记出教室特征,使用标记好的标签对YOLOV4目标检测网络模型进行训练调优,使YOLOV4目标检测网络模型1检测出图像或者视频中的教室特征;自训练的YOLOV4目标检测网络模型2单元:使用公开COCO的数据集对YOLOV4目标检测网络模型训练,使YOLOV4目标检测网络模型2输出图像或视频中人物信息;自建的卷积神经网络模型单元:使用Prelu作为激活函数,优化器为Adabound,首层加入数据增强层,每层使用BatchNormalization进行批量归一化,最后一层使用softmax函数对教学视频关键帧进行分类;所述自建的卷积神经网络模型单元包括5个卷积层,1个池化层,一个Dropout层和2个全连接层依次连接组成;其中有3个卷积层的卷积核大小为3*3,步长为1,2个卷积层的卷积核大小为3*3,步长为2,步长为1的卷积层和步长为2的卷积层交叉排列;池化层的大小为2*2,步长为2,连接在最后一个卷积层后;第一个全连接层的大小为256;Dropout层的参数为0.3;第二个全连接层的大小为分类视频类别的大小;输入层的大小为28*28*3。
全文数据:
权利要求:
百度查询: 华中师范大学 一种基于不同呈现方式的教学视频自动化分类方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。