一种全局与局部互补的双向注意的视频问答方法与系统

导航：龙图腾网> 最新专利技术> 一种全局与局部互补的双向注意的视频问答方法与系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中山大学

摘要：本发明公开了一种全局与局部互补的双向注意的视频问答方法与系统。包括：首先对数据集进行预处理，利用多头自注意力层和卷积层获取具有全局和局部上下文信息的特征，然后利用图注意机制进行聚合，最后通过将获取的特征输入答案预测模块，进行模型训练和预测。本发明利用多头自注意力机制提取完整的全局上下文信息，利用一维卷积神经网络网络提取精确的局部上下文信息，实现更加完整和精确的特征提取。同时，本发明以不同的顺序堆叠多头自注意力层和一维卷积层，使全局信息和局部信息相互补充与融合，实现了特征表示的多步推理过程。本发明通过对答案预测模块的修改，能够在多项视频问答任务中发挥作用，提高精确度，也拓展了应用场景。

主权项：1.一种全局与局部互补的双向注意的视频问答方法，其特征在于，所述方法包括：将视频问答数据集划分为训练集与测试集，从训练集中获取原始视频、相应的文本问题和答案标识；对所述原始视频、所述文本问题进行预处理操作，获得视频的外观特征表示、运动特征表示和问题表示；将所述问题表示进行平铺处理，获得平铺张量，将其与所述外观特征表示和所述运动特征表示对齐，形成特征表示组合；利用多头注意力层和一维卷积层堆叠组成的全局与局部双向注意模块，对所述特征表示组合进行处理，分别获得具有全局与局部上下文信息的外观特征和运动特征；对所述特征表示组合分别处理，构建无向全连接的外观图和运动图，利用图注意机制进行聚合操作，获得具有全局上下文信息的外观特征和运动特征；构建答案预测模块，将所述具有全局与局部上下文信息的外观特征和运动特征，以及所述具有全局上下文信息的外观特征和运动特征进行连接，得到最终特征，并将其与所述问题表示作为预测模块的输入，进行模型训练操作，得到训练好的答案预测模型；从所述测试集获取目标视频和问题，重复所述预处理操作，根据问题类型将处理结果输入所述训练好的答案预测模型，输出需要获取的视频问答答案。

全文数据：

权利要求：

百度查询：中山大学一种全局与局部互补的双向注意的视频问答方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种文件下载方法、装置以及车辆

下一篇：一种激光直写纸基多通道LIG传感器的制备方法及其应用

相关技术

一种文件下载方法、装置以及车辆

一种激光直写纸基多通道LIG传感器的制备方法及其应用

一种(R)-3-氨基哌啶双盐酸盐的制备方法及转氨酶

一种电子元件贴片机械臂及其贴片方法

半导体器件和用于转移半导体器件的方法

防渗材料、其制备方法及应用

一种升压变/换流变压器可靠性评价方法

一种猪饲料加工用粉碎装置

一种市政施工给水排污管道组件

电感器

一种塑料周转盘吸塑成型设备及其使用方法

β-微管蛋白作为筛选防治Didymella segeticola的杀菌剂作用靶标、作用机制及其应用

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种全局与局部互补的双向注意的视频问答方法与系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务