首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】跨模态视频检索方法、装置及电子设备_中国科学院自动化研究所_202410644212.7 

申请/专利权人:中国科学院自动化研究所

申请日:2024-05-23

公开(公告)日:2024-06-21

公开(公告)号:CN118227831A

主分类号:G06F16/78

分类号:G06F16/78;G06F16/783;G06N3/0455;G06N3/08

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:本发明涉及视频检索技术领域,提供一种跨模态视频检索方法、装置及电子设备,方法包括:提取查询文本的隐式特征和词表特征;基于特征提取模型,得到各候选视频的隐式特征和各候选视频的词表特征;基于查询文本的隐式特征与各候选视频的隐式特征之间的相似度以及查询文本的词表特征与各候选视频的词表特征之间的相似度,确定查询文本对应的检索视频;特征提取模型的词表特征训练阶段以最小化样本视频的词表特征与样本描述文本的词表特征之间的差异为训练目标,联合训练阶段以样本视频的隐式特征与样本描述文本的隐式特征之间的相似度作为软标签,最小化学生预测结果与软标签之间的差异为训练目标。本发明能够提高跨模态视频检索能力。

主权项:1.一种跨模态视频检索方法,其特征在于,包括:提取查询文本的隐式特征和词表特征;将各候选视频以及各候选视频的描述文本输入至特征提取模型,得到所述特征提取模型输出的各候选视频的隐式特征和各候选视频的词表特征;基于所述查询文本的隐式特征与各候选视频的隐式特征之间的相似度,以及所述查询文本的词表特征与各候选视频的词表特征之间的相似度,从各候选视频中确定所述查询文本对应的检索视频;所述特征提取模型基于样本视频以及所述样本视频的样本描述文本训练得到,所述特征提取模型的训练阶段包括词表特征训练阶段以及联合训练阶段,所述词表特征训练阶段以最小化所述样本视频的词表特征与所述样本描述文本的词表特征之间的差异为训练目标,所述联合训练阶段以所述样本视频的隐式特征与所述样本描述文本的隐式特征之间的相似度作为软标签,最小化学生预测结果与所述软标签之间的差异为训练目标,所述学生预测结果指所述样本视频的词表特征与所述样本描述文本的词表特征之间的相似度。

全文数据:

权利要求:

百度查询: 中国科学院自动化研究所 跨模态视频检索方法、装置及电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。