首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多模态跨领域的图文互搜方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京科技大学

摘要:本发明涉及多模态学习和跨领域适应技术领域,特别是指一种基于多模态跨领域的图文互搜方法及装置,方法包括:确定源图像特征数据、对应的源语言特征数据、目标图像特征数据或目标语言特征数据;根据目标图像特征数据、排序感知器、概念分类器以及领域判断器,确定包含未知概念的目标域图像以及、其它图像;根据目标域图像、源语言特征数据以及目标语言特征数据,生成目标域样本以及其它样本;根据源领域数据、目标领域数据、目标域样本以及其它样本,对待训练的图文互搜模型进行训练,得到训练好的图文互搜模型根据训练好的图文互搜模型进行图文搜索。采用本发明,可以促进跨领域适应,提高图文互搜的准确率和效率。

主权项:1.一种基于多模态跨领域的图文互搜方法,其特征在于,所述方法包括:S1、获取源领域数据、目标领域数据以及待训练的图文互搜模型;其中,所述源领域数据包括多个图文对,每个图文对包括源图像数据以及对应的源语言数据;所述目标领域数据包括多个目标图像数据或目标语言数据;所述图文互搜模型包括特征提取模块、排序感知器、概念分类器以及领域判断器;S2、基于所述特征提取模块以及源领域数据的图文对,确定源图像特征数据以及对应的源语言特征数据,基于所述特征提取模块以及目标领域数据,确定目标图像特征数据或目标语言特征数据;S3、基于所述源图像特征数据、源语言特征数据以及相对排名损失函数,对排序感知器进行训练;S4、根据目标图像特征数据、训练后的排序感知器、概念分类器以及领域判断器,将所述目标图像特征数据分为包含未知概念的目标域图像以及不包含未知概念的其它图像;S5、根据所述目标域图像、源语言特征数据以及目标语言特征数据,生成目标域样本,根据其它图像以及源语言特征数据,生成其它样本;其中,每个目标域样本包括一个目标域图像以及对应的伪语言特征,每个其它样本包括一个其它图像以及对应的伪语言特征;S6、根据源领域数据、目标领域数据、目标域样本以及其它样本,对待训练的图文互搜模型进行训练,得到训练好的图文互搜模型;S7、获取单模态的待搜索数据,将所述待搜索数据输入到训练好的图文互搜模型,得到所述待搜索数据对应的搜索结果。

全文数据:

权利要求:

百度查询: 北京科技大学 一种基于多模态跨领域的图文互搜方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。