【发明授权】一种基于双模特征和注意力机制的视频摘要方法及装置_嘉兴学院;浙江省电子信息产品检验研究院(浙江省信息化和工业化融合促进中心)_202011481458.5

申请/专利权人：嘉兴学院;浙江省电子信息产品检验研究院(浙江省信息化和工业化融合促进中心)

申请日：2020-12-15

公开（公告）日：2024-06-18

公开（公告）号：CN113158720B

主分类号：G06V20/40

分类号：G06V20/40;G06V20/52;G06V10/80;G06V40/20;G06V10/82;G06N3/0464;G06V10/774

优先权：

专利状态码：有效-授权

法律状态：2024.06.18#授权;2021.08.10#实质审查的生效;2021.07.23#公开

摘要：本发明公开一种基于双模特征和注意力机制的视频摘要方法及装置，该方法包括：通过马尔科夫随机场模型和自适应阈值法对视频数据进行预处理；对预处理后的视频数据进行双模特征提取；对该短时声音能量特征和视觉运动强度特征的融合结果进行平滑处理，以获取针对于该视频数据的用户注意力曲线；根据预先设定的目标视频片段确定策略，在该用户注意力曲线中确定出用户注意力高于预设的注意力阈值的目标视频片段；通过预先训练好的异常行为识别模型获取该目标视频片段中的异常行为。能够对冗长的监控视频进行自动浓缩，提取出其中用户感兴趣的片段，自动识别视频中运动目标和异常行为，实现监控视频的智能高效浏览，减轻工作人员负担，提高监控效率。

主权项：1.一种基于双模特征和注意力机制的视频摘要方法，其特征在于，所述方法包括：通过马尔科夫随机场模型和自适应阈值法对视频监控器在第一时间段内拍摄到的视频数据进行预处理，其中，通过马尔科夫随机场模型对拍摄到的视频数据中的视频背景进行建模，包括：将输入视频帧X＝{xs|s∈S}从RGB颜色空间转换为YcbCr空间，忽略其亮度分量，其中S表示输入视频帧中的像素点集，xs表示视频帧上像素点的观测值；初始化视频帧的分类数K、固定势函数β以及算法最大迭代次数T；利用K-均值算法计算视频帧初始分割结果；根据下式估计特征场均值参数μ：其中，Nm是视频帧中被标记为第m类的像素的个数，ys表示视频帧中像素点s对应的标号；根据下式估计特征场方差参数σ2：将μ和σ2代入下式计算特征场能量：其中，Y＝{ys|s∈S}表示标号场；根据下式计算标号场能量：E2Y＝∑c∈CVcYc，其中VcYc是定义在标号场Y的势团c上的势能函数，采用二阶邻域模型：计算标号场和特征场总能量，更新像素点标号，并遍历计算，与上次迭代后的总量相比较，直至能量差值小于设定的阈值或迭代次数为T为止；通过自适应阈值法对镜头的边界进行检测，包括：将输入视频帧从RGB颜色空间转换为HSV空间；将视频帧大小调整为S×S，划分成大小为B×B的帧块，其中BS；对视频帧进行维纳滤波；根据下式计算每个图像块的局部二值模式特征LBP；其中，P是圆形邻域中的像素点的个数，R是邻域半径，Ix,y表示圆形邻域中心点的亮度值，L为门限函数，计算输入视频帧的局部二值模式特征直方图，并对该直方图进行归一化处理，将每个帧块的局部二值模式特征直方图连接得到输入视频帧LBP特征向量；计算相邻视频帧LBP特征向量的欧式距离，得到相邻视频帧间差Δ＝Δ1,Δ2,…,ΔN，N为视频帧总数；如果相邻视频帧间差Δi大于阈值ρ，则认为该处产生突变，为镜头边界，其中ρ是自适应阈值，ρ＝μΔ+σΔ×γ，μΔ为Δ的均值，σΔ为Δ的方差，γ为取值范围[1,3]的常数；对预处理后的视频数据进行双模特征提取，其中，所述双模特征包括短时声音能量特征和视觉运动强度特征；对所述短时声音能量特征和视觉运动强度特征的融合结果进行平滑处理，以获取针对于所述视频数据的用户注意力曲线；根据预先设定的目标视频片段确定策略，在所述用户注意力曲线中确定出用户注意力高于预设的注意力阈值的目标视频片段；通过预先训练好的异常行为识别模型获取所述目标视频片段中的异常行为；所述通过预先训练好的异常行为识别模型获取所述目标视频片段中的异常行为，包括：分别对每个目标视频片段进行均匀采样，获取长度为N的视频帧序列；通过预先训练好的卷积神经网络模型提取所述视频帧序列的特征向量F＝{f1,f2,…,fN}；将所述视频帧序列的特征向量F输入长短时记忆网络，获取长度为N的隐状态序列H＝{h1,h2,…,hN}；将隐状态序列H输入注意力网络，通过注意力值确定公式计算每个隐状态的注意力值；其中所述通过注意力值确定公式为：αn＝softmaxWThn+b，其中，αn为第n个隐状态的注意力值，W和b分别为多层感知机的权重和偏置；通过注意力机制结合公式将特征向量F与注意力值向量α加权，得到结合注意力机制的特征向量Fatt；其中，所述注意力机制结合公式为：将所述结合注意力机制的特征向量Fatt作为softmax分类器的输入，根据所述softmax分类器输出的结果确定所述异常行为。

全文数据：

权利要求：

百度查询：嘉兴学院;浙江省电子信息产品检验研究院(浙江省信息化和工业化融合促进中心) 一种基于双模特征和注意力机制的视频摘要方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种Invar合金焊丝及其制备、焊接方法_西安钢研功能材料股份有限公司_202311708375.9

下一篇：一种冰醋酸中微量乙酸酐的检测方法_浙江圣兆药物科技股份有限公司_202211266952.9

相关技术

一种Invar合金焊丝及其制备、焊接方法_西安钢研功能材料股份有限公司_202311708375.9

一种冰醋酸中微量乙酸酐的检测方法_浙江圣兆药物科技股份有限公司_202211266952.9

一种柔性低密度烧蚀防热涂料及其制备方法_上海箬宇新材料有限公司_202310043235.8

一种轻量非晶合金及其制备方法_东莞市逸昊金属材料科技有限公司_202211701845.4

城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

一种感染科医用防护用具回收设备_丰都县十直镇卫生院(丰都县十直镇计划生育服务站)_202210727764.5

一种诱导阴地蕨孢子萌发、有效培养原叶体的培养基及方法_毕节市中药研究所_202310551441.X

一种可变任意尺寸模具的挤吹机及其挤吹工艺_晋江里弗兰新材料有限公司_202410445743.3

一种齿轮加工成型设备_兴化金马鹿机电科技有限公司_202410356685.7

一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

耐拉伸航空用电缆_广东南缆电缆有限公司_202410436836.X

利拉鲁肽的合成_拜康有限公司_201780086325.8

机制相关技术

一种锚机制动装置_江苏政田重工股份有限公司_202410652635.3

一种机制砂下料斗_中核混凝土股份有限公司_202322709208.8

用于处理模式改变的机制_硕动力公司_202280075345.6

具有蜗轮定位机制的电动缸_第一传动科技股份有限公司_202211651786.4

用于控制驱动器装置的机制_昕诺飞控股有限公司_202180005540.7

一种机制砂混凝土的混合搅拌装置_济南建工集团建材科技有限公司_202420159569.1

一种机制砂颗粒风化程度检测方法_中建西部建设湖南有限公司_202410642861.3

基于相关性的更新机制_戴尔产品有限公司_202211660116.9

自校准机制的无监督弱光图像增强方法_西安理工大学_202410335322.5

基于投票机制的特征转换多任务的胃肠道肿瘤分割网络_太原科技大学_202410406544.1

视频相关技术

视频编码方法_杭州当虹科技股份有限公司_202110598168.7

视频图像控制装置、视频控制器及音视频一体机_珠海视熙科技有限公司_202320151868.6

视频播放方法及装置_维沃移动通信有限公司_202210045065.2

在视频编译系统中使用残差信息的视频解码方法及其设备_LG电子株式会社_202080018152.8

视频抽帧方法、分布式视频分析方法及系统_浪潮通信信息系统有限公司_202410210395.1

视频封面的生成方法、视频发布方法及相关设备_广州虎牙科技有限公司_202210376326.9

基于视频监控和视频会议融合的智能系统_深圳市炫本电子有限公司_202210768285.8

视频解码方法、视频编码设备以及存储比特流的方法_三星电子株式会社_202410344004.5

视频显示方法及装置、控制器、视频显示系统_北京电科智芯科技有限公司_202410476209.9

用于视频解码的方法和设备以及用于视频编码的方法和设备_三星电子株式会社_202410338558.4

摘要相关技术

一种文档摘要的生成方法和装置_联想(北京)有限公司_202410466025.4

一种基于输入共享的文本摘要生成方法_华南理工大学_202210248412.1

基于强化学习和图摘要的图数据库查询成本估计方法_复旦大学_202410289952.3

一种基于SM3国密算法的SFTP文件传输摘要校验方法_深圳市证通云计算有限公司_202110740638.9

摘要生成方法、装置、设备及介质_北京沃东天骏信息技术有限公司_202011257146.6

摘要信息生成与搜索结果展示方法、装置、设备和介质_抖音视界有限公司_202210689553.7

基于大语言模型的幂等机制生成教育文本摘要方法_武汉理工大学_202410332199.1

一种基于双模特征和注意力机制的视频摘要方法及装置_嘉兴学院_202011481458.5

一种基于多句压缩的无监督科技情报摘要自动生成方法_北京理工大学_202210275509.1

视频摘要处理方法、系统、可读存储介质及计算机设备_江西科技学院_202410257744.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于双模特征和注意力机制的视频摘要方法及装置_嘉兴学院;浙江省电子信息产品检验研究院(浙江省信息化和工业化融合促进中心)_202011481458.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务