基于属性信息和大型基础模型的车辆目标检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：芜湖辛巴网络科技有限公司

摘要：本发明公开一种基于属性信息和大型基础模型的车辆目标检测方法，主干网络获取图像的原始特征；使用区域建议模块生成候选区域，由感兴趣区域对齐模块将候选区域与原始特征图对齐获得视觉特征；基于候选区域从原始图像中裁剪候选区域图像；通过视觉特征增强模块来提取各个候选区域图像的特征，得到增强特征；将视觉特征与增强特征拼接获得最终视觉表示；通过损失约束视觉表示和语义表示更相似，从而对齐视觉表示和语义表示来弥补语义的差异。本发明通过视觉特征增强模块增强主干网络提取的原始图像特征，通过属性表示学习模块将候选区域的属性向量组融合统一，最后采用利用对比学习方法来对齐视觉表示和语义表示来弥补语义的差异。

主权项：1.一种基于属性信息和大型基础模型的车辆目标检测方法，其特征在于，包括以下步骤：步骤1、获取原始图像，并将原始图像输入主干网络，由主干网络提取获得原始特征图；步骤2、对于步骤1所得原始特征图，先使用区域建议模块生成一组候选区域，然后通过感兴趣区域对齐模块将候选区域的位置坐标在原始特征图中对应的区域进行池化，池化为固定尺寸，获得视觉特征Fr；对于区域建议模块生成的一组候选区域，同时从原始图像中裁剪出候选区域图像，得到候选区域图像集；步骤3、对于步骤2所得候选区域图像集，通过视觉特征增强模块来提取各个候选区域图像的特征，进而增强步骤1所得原始特征图，得到候选区域图像对应的增强特征步骤4、使用属性表示学习模块获得候选区域的属性表示，具体方法为：步骤4.1、使用大语言模型T5对车辆的属性词进行编码，得到文本特征；步骤4.2、将增强特征和文本特征共同输入预训练的属性预测网络，预测得到每个候选区域图像对应的属性信息，即候选区域的预测属性；步骤4.3、通过门控循环单元将每个候选区域的属性特征转换为统一的语义属性表示Va，即属性向量；步骤5、将视觉特征Fr与增强特征沿通道拼接，获得最终视觉表示Fv，将最终视觉表示Fv输入到分类头和回归头，获得检测结果；然后，计算每个候选区域的最终视觉表示Fv和语义属性表示Va之间的余弦嵌入损失，通过余弦嵌入损失约束视觉表示和语义表示更相似，从而对齐视觉表示和语义表示来弥补语义的差异。

全文数据：

权利要求：

百度查询：芜湖辛巴网络科技有限公司基于属性信息和大型基础模型的车辆目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种1.0-2.0mm厚度热基镀锌原料的生产方法

下一篇：一种消化内科催吐装置

相关技术

一种1.0-2.0mm厚度热基镀锌原料的生产方法

一种消化内科催吐装置

一种带有短路检测的连接器插针机

基于场景感知的自动化编队群组引导方法

一种物体边沿位置的检测装置及方法

一种高压线路电气控制机构

牙冠的宽度数值确定方法、装置、设备及存储介质

一种道路靶向安全警示系统、其使用方法及多个系统之间建立私有局域网的使用方法

一种新型鹅星状病毒疫苗及其制备方法与应用

逆变器动态功率解耦控制方法及装置

性别判定模型的生成方法、装置、电子设备及介质

一种基于子载波间隔压缩的非正交chirp多载波传输方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于属性信息和大型基础模型的车辆目标检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务