首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种全局与局部互补的双向注意的视频问答方法与系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中山大学

摘要:本发明公开了一种全局与局部互补的双向注意的视频问答方法与系统。包括:首先对数据集进行预处理,利用多头自注意力层和卷积层获取具有全局和局部上下文信息的特征,然后利用图注意机制进行聚合,最后通过将获取的特征输入答案预测模块,进行模型训练和预测。本发明利用多头自注意力机制提取完整的全局上下文信息,利用一维卷积神经网络网络提取精确的局部上下文信息,实现更加完整和精确的特征提取。同时,本发明以不同的顺序堆叠多头自注意力层和一维卷积层,使全局信息和局部信息相互补充与融合,实现了特征表示的多步推理过程。本发明通过对答案预测模块的修改,能够在多项视频问答任务中发挥作用,提高精确度,也拓展了应用场景。

主权项:1.一种全局与局部互补的双向注意的视频问答方法,其特征在于,所述方法包括:将视频问答数据集划分为训练集与测试集,从训练集中获取原始视频、相应的文本问题和答案标识;对所述原始视频、所述文本问题进行预处理操作,获得视频的外观特征表示、运动特征表示和问题表示;将所述问题表示进行平铺处理,获得平铺张量,将其与所述外观特征表示和所述运动特征表示对齐,形成特征表示组合;利用多头注意力层和一维卷积层堆叠组成的全局与局部双向注意模块,对所述特征表示组合进行处理,分别获得具有全局与局部上下文信息的外观特征和运动特征;对所述特征表示组合分别处理,构建无向全连接的外观图和运动图,利用图注意机制进行聚合操作,获得具有全局上下文信息的外观特征和运动特征;构建答案预测模块,将所述具有全局与局部上下文信息的外观特征和运动特征,以及所述具有全局上下文信息的外观特征和运动特征进行连接,得到最终特征,并将其与所述问题表示作为预测模块的输入,进行模型训练操作,得到训练好的答案预测模型;从所述测试集获取目标视频和问题,重复所述预处理操作,根据问题类型将处理结果输入所述训练好的答案预测模型,输出需要获取的视频问答答案。

全文数据:

权利要求:

百度查询: 中山大学 一种全局与局部互补的双向注意的视频问答方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。