基于时空强化学习的跨模态视频时刻定位方法

导航：龙图腾网> 最新专利技术> 基于时空强化学习的跨模态视频时刻定位方法

申请/专利权人：湖南大学

申请日：2020-06-18

公开（公告）日：2024-06-25

公开（公告）号：CN111782871B

主分类号：G06F16/732

分类号：G06F16/732;G06F16/783;G06V20/40;G06V10/82;G06N3/084;G06N3/092

优先权：

专利状态码：有效-授权

法律状态：2024.06.25#授权;2020.11.03#实质审查的生效;2020.10.16#公开

摘要：本发明提供了一种基于时空强化学习的跨模态视频时刻定位方法，包括以下步骤：S01、输入完整视频和查询语句，抽取视频特征和查询语句特征，构建强化学习环境；S02、基于强化学习环境信息进行时序强化学习并定位视频的时序边界，环境信息包括视频全局特征、视频局部特征、定位边界和查询语句特征；S03、基于时序强化学习的定位边界进行空间强化学习，在所述环境中处理空间信息并逐帧追踪相关场景，并用注意力机制过滤无关信息；S04、根据空间强化学习更新时序强化学习的局部片段特征，使得所述空间强化学习和所述时序强化学习交替训练，直至收敛，得到对应查询语句的视频时刻片段。本发明提供的方法能够返回精确的视频定位边界，提高用户的查询体验。

主权项：1.一种基于时空强化学习的跨模态视频时刻定位方法，其特征在于，包括以下步骤：S01、输入完整视频和查询语句，抽取视频特征和查询语句特征，构建强化学习环境；S02、基于强化学习环境信息进行时序强化学习并定位视频的时序边界，所述环境信息包括视频全局特征、视频局部特征、定位边界和查询语句特征；S03、基于所述时序强化学习的定位边界进行空间强化学习，在所述环境中处理空间信息并逐帧追踪相关场景，并用注意力机制过滤无关信息；S04、根据空间强化学习更新时序强化学习的局部片段特征，使得所述空间强化学习和所述时序强化学习交替训练，直至收敛，得到对应查询语句的视频时刻片段，所述步骤S02中，所述时序强化学习步骤包括：定义状态为set＝[fe，lt，fot，fg]，其中fe为查询语句特征、lt为位置特征、fot为所述位置特征相应的空间信息特征，fg为视频全局特征，t是当前时间步；定义时序强化学习智能体的动作Ae，所述动作Ae包括同时向前移动起点、同时向前移动终点、同时向后移动起点、同时向后移动终点、单独向前向后移动起点和终点、单独向后移动起点和终点以及停止动作；设置所述时序强化学习智能体移动的初始位置为L0＝[0.25*n，0.75*n]，其中n是视频图像帧的总长度，动作每步的移动大小设置为n2ze，其中ze为确定的超参数；定义智能体的最大搜索步数；所述时序强化学习智能体从环境中获取所述状态后，执行动作Ae，使用IoU评估后得到每步的奖励，所述步骤S02中，使用IoU进行评估的公式为：根据IoU的计算结果，定义所述时序强化学习智能体每步移动的奖励ret为：其中，φ为惩罚系数，当IoUt大于IoUt-1，则当前动作将被视为正反馈，奖励为正，否则奖励为零或负，同时减去一个智能体对步数的惩罚，步骤S03中，所述空间强化学习使用目标跟踪框算法实现观察输入视频帧的空间信息，并输出连续图像帧的空间边界，步骤S03中，所述目标跟踪框算法包括：定义状态为ssk＝[fe,fok,fs]，其中fe为查询语句特征，fok为空间信息特征，fs为由时序强化学习定位到的局部视频特征，t是当前时间步；定义空间强化学习智能体的动作，控制局部目标框的移动，所述动作包括左移、右移、上移、下移、放大、缩小、变长、变宽以及停止动作；设置目标跟踪框为b＝[x，y，m，n]，其中[x，y]是目标跟踪框的中心点，[m，n]是所述目标跟踪框的大小；设置初始位置为b0＝[0.25*h，0.25*w，0.75*h，0.75*w]，其中h和w为图像帧的高度和宽度；设置步长为垂直方向的h2zs和水平方向的w2zs，其中zs为超参数；所述空间强化学习智能体使用IoU进行评估，得到其奖励函数r为：其中Q值为状态执行动作后获得的期望回报，当更新特征后的Q值Qo大于更新前的Q值Qw，则奖励为1，Q值Qo不变则奖励为0，Q值Qo小于更新前的Q值Qw则奖励为-1。

全文数据：

权利要求：

百度查询：湖南大学基于时空强化学习的跨模态视频时刻定位方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于防潮功能的变频器控制箱

下一篇：一种散热机箱

相关技术

一种基于防潮功能的变频器控制箱

一种散热机箱

一种护理液调和储存罐

一种移动式自填充胶枪

一种高效物流包装码垛装置

一种改良聚乙烯颗粒物挤出成型设备

一种高强度组合式不锈钢管

一种裁断效果好的液压裁断机

一种带液晶显示屏可调速的墙体切割机

一种模具加工用定位装置

一种具有调节功能的塑料藤条结构椅

一种用于治疗小儿肌性斜颈的固定器

态相关技术

一种分离稀土元素的三价态离子与四价态离子的方法_中国科学院赣江创新研究院_202211699181.2

时序中间态聚合图构建与查询方法、装置、设备及介质_浙江邦盛科技股份有限公司_202410676028.0

基于量子振幅衰减信道Z混态表达式的量子误差缓解方法_南京邮电大学_202410678135.7

一种螺旋藻营养液硝态氮分离加工机构_内蒙古再回首生物工程有限公司_202421242703.0

一种大巴用太阳能异聚态板热泵空调系统_郑州科林车用空调有限公司_202323486884.X

光学加密结构的设计方法及多偏振态光学加密系统_之江实验室_202311109689.7

一种深水大体积基础浮态接高双壁钢套箱_中建八局第二建设有限公司_202310050846.5

一种热态铝灰的处理工艺和装置_北京科技大学_202410431602.6

一种电解液循环制备脱锂态正极材料的设备_中国电子科技集团公司第十八研究所_202323004593.2

一种带有频率转换功能的量子隐形传态系统及方法_华南师范大学_202410351968.2

模相关技术

模约简的方法及模约简模块_支付宝(杭州)信息技术有限公司_202410347710.5

洞口吊模封堵装置_上海宝冶建筑装饰有限公司_202323149942.X

快速换模夹紧机构_苏州施米特机械有限公司_201910759315.7

一种翻模器_新疆路桥建设集团有限公司_202323091268.4

翻孔成型用凹模_河南平高电气股份有限公司_202322936658.0

模内攻牙调平结构_昆山嘉升精密电子工业有限公司_202322356817.X

涂布垫片和涂布模头_武汉绿动氢能能源技术有限公司_202323238231.X

一种开模防带起装置_唐山贺祥智能科技股份有限公司_202410357050.9

多向模锻液压机模座定位导向装置_中国二十二冶集团有限公司_202323182154.0

滑座消失模及其用于铸造滑座的方法_南京龙宁机床装备有限公司_201710873745.2

跨相关技术

跨乘式车辆_雅马哈发动机株式会社_202311807345.3

跨膜新抗原肽_居里研究所_202280033953.0

跨设备分屏方法及相关装置_华为技术有限公司_202211695536.0

一种基于区块链跨链的车联网跨域服务公平可信提供方法_北京交通大学_202410408472.4

基于跨尺度与跨模态注意力机制的药物-靶标结合亲和力预测方法_重庆大学_202410505535.8

一种跨平台框架的快速构建方法_广州知韫科技有限公司_202410494027.4

跨链转移数据处理方法及装置_杭州高新区(滨江)区块链与数据安全研究院_202410346108.X

制动液压控制装置及跨乘型车辆_罗伯特·博世有限公司_202180017301.3

用于跨乘式车辆的收纳盒_雅马哈发动机株式会社_202311808252.2

一种FPGA跨时钟分析检测方法_成都迪真计算机科技有限公司_202410684834.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于时空强化学习的跨模态视频时刻定位方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务