Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜天津理工大学张建庆获国家专利权

恭喜天津理工大学张建庆获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜天津理工大学申请的专利一种联合图文匹配和视觉推理的多任务学习模型、视觉常识推理方法及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114996502B

龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210718706.6,技术领域涉及:G06F16/583;该发明授权一种联合图文匹配和视觉推理的多任务学习模型、视觉常识推理方法及计算机设备是由张建庆;张飞飞;徐常胜设计研发完成,并于2022-06-23向国家知识产权局提交的专利申请。

一种联合图文匹配和视觉推理的多任务学习模型、视觉常识推理方法及计算机设备在说明书摘要公布了:本发明公开了一种联合图文匹配和视觉推理的多任务学习模型、视觉常识推理方法及计算机设备。视觉常识推理部分使用预训练模型提取图像和文本的特征,得到视觉模态和文本模态的联合表示,再使用多类交叉熵损失函数进行优化训练;然后对视觉常识推理原始数据集进行处理,以用于图文匹配模块;图文匹配部分,先提取图像的像素级特征作为全局特征,提取图像的区域级特征作为局部特征,再通过对比学习损失函数对图文匹配进行优化训练;最后通过参数共享实现图文匹配和视觉常识推理双向促进。本发明提高了模型对多样化的视觉内容和高级文本语义联合推理能力,使模型更好地对齐两种模态。通过图文匹配和视觉推理双向促进,提高视觉常识推理任务的性能。

本发明授权一种联合图文匹配和视觉推理的多任务学习模型、视觉常识推理方法及计算机设备在权利要求书中公布了:1.一种联合图文匹配和视觉推理的多任务学习模型的构建方法,其特征在于,包括如下步骤: S1:提取原始图片和文本的特征,并得到视觉模态和文本模态的联合表示; S2:使用多类交叉熵损失函数对视觉常识推理进行优化训练; S3:对视觉常识推理原始数据集进行数据处理,使之用于图文匹配; S4:提取图像的像素级特征作为全局特征,提取图像的区域级特征作为局部特征; S5:通过对比学习损失函数对图文匹配进行优化训练; S6:通过参数共享实现图文匹配和视觉常识推理的双向促进,融合上述过程得到多任务学习模型; 所述S6的具体实现包括:所述多任务学习模型通过以下融合方式得到: L=L1+λ1Lg_sim+λ2Ll_sim 这里的λ1,λ2是平衡化参数,L1是视觉常识推理的损失函数,Lg_sim是整个图像和整个句子之间的对比损失函数,Ll_sim是图像区域和单词之间的对比损失函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津理工大学,其通讯地址为:300384 天津市西青区宾水西道391号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。