一种基于近邻排序关系的跨模态检索方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华侨大学;厦门亿联网络技术股份有限公司

摘要：本发明公开了一种基于近邻排序关系的跨模态检索方法，包括：构建用于图像模态数据以及文本模态数据的深度语义特征提取的深度神经网络模型；将图像数据与文本数据对分别输入到所述深度神经网络模型中进行训练；结合近邻样本排序损失函数和语义相似度度量损失函数，计算语义对齐的损失值，通过训练缩小损失值，得到训练好的深度神经网络模型；通过训练好的深度神经网络模型提取到图像数据和文本数据间的公共语义表达，并将图像的深度语义特征与文本的深度语义特征转化到公共语义空间中，实现语义相似度的度量和检索。本发明方法能够有效地实现图像和文本两种不同模态数据间的跨模态检索。

主权项：1.一种基于近邻排序关系的跨模态检索方法，其特征在于，包括：构建用于图像模态数据以及文本模态数据的深度语义特征提取的深度神经网络模型；将图像数据与文本数据对分别输入到所述深度神经网络模型中进行训练；结合近邻样本排序损失函数和语义相似度度量损失函数，计算语义对齐的损失值，通过训练缩小所述损失值，得到训练好的深度神经网络模型；通过训练好的深度神经网络模型提取到图像数据和文本数据间的公共语义表达，并将图像的深度语义特征与文本的深度语义特征转化到公共语义空间中，实现语义相似度的度量和检索；其中将图像数据与文本数据对分别输入到所述深度神经网络模型中进行训练，包括：将图像数据集输入到图像特征提取网络，其中n表示图像数量；具体为将图像数据输入到VGG-19卷积网络，再通过全连接网络后获得图像数据的深度语义特征；所述VGG-19卷积网络通过ILSVRC-ImageNet数据集进行预训练；将文本数据集输入到文本特征提取网络；具体为将文本数据的内容输入Glove语言模型，将生成的词向量通过全连接网络后获得文本数据的深度语义特征；所述Glove语言模型通过GoogleNews数据集进行预训练；所述图像数据的深度语义特征表示如下：Xf＝NetimgX其中，Xf表示图像数据的深度语义特征；Netimg表示图像特征提取网络；文本数据的深度语义特征表示如下：Yf＝NettxtY其中，Yf表示文本数据的深度语义特征；Nettxt表示文本特征提取网络；所述近邻样本排序损失函数的定义如下： σ函数定义如下： tij的定义如下：其中，k表示当前第k个检索样本；i和j分别表示被检索的第i和j个样本；m表示被检索数据集；表示第i个被检索数据与第k个检索数据之间的特征相似度；表示第j个被检索数据与第k个检索数据之间的特征相似度；表示第i个被检索数据与第k个检索数据之间的相似排序关系；表示第j个被检索数据与第k个检索数据之间的相似排序关系。

全文数据：

权利要求：

百度查询：华侨大学厦门亿联网络技术股份有限公司一种基于近邻排序关系的跨模态检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种批量热浸镀锌铝镁浸镀前两步式活化助镀处理方法

下一篇：一种大数据检索方法、装置以及可读存储介质

相关技术

一种批量热浸镀锌铝镁浸镀前两步式活化助镀处理方法

一种大数据检索方法、装置以及可读存储介质

一种单元幕墙系统内嵌装饰线条的结构体系

一种重型机械龙门自动焊接装置

天然气发动机配气相位控制方法和天然气发动机

一种人脸识别环卫作业电子工牌

一种惯性传感器探头装置及多自由度检测方法

用于车辆空调系统的控制方法、装置、程序产品及介质

一种变电站无人机巡视路径规划方法及系统

声纳图像的可视化处理方法、系统和计算装置

一种黄芩病虫害识别系统及方法

一种烟叶分拣定级用的翻转分料装置及方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于近邻排序关系的跨模态检索方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务