一种生成低迁移差距视觉自监督学习模型的方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：苏州大成运和智能科技有限公司

摘要：本发明公开了一种生成低迁移差距的视觉自监督学习模型的方法，包括以下步骤：S1，确定主干网络和颈部网络；S2，对主干网络进行简化；S3，生成中间重建标签xs；S4，确定多阶段损失函数l；S5，构建待训练模型；S6，获取上游任务数据集和下游任务数据集；S7，对待训练模型进行训练；S8，对预训练模型进行微调。本发明的方法使用了颈部网络来进行重建和识别，从而最大限度地减少了训练前和微调之间的迁移差距。而且本发明的方法设计了掩码特征建模MFM任务来补充掩码图像建模MIM，以更好地优化颈部网络。经过本方法预训练的视觉识别模型在无人物流区对障碍物的识别具有较高的识别准确率。

主权项：1.一种生成低迁移差距的视觉自监督学习模型的方法，其特征在于，包括以下步骤：S1，确定主干网络和颈部网络，具体包括以下步骤：S11，确定主干网络fx；θ：fx；θ＝U0，U1，U2，…Us；其中，x为输入的图像；θ为主干网络的可学习参数；U0代表输入图像x切片后的结果，Us则表示主干网络第s个阶段输出的主干网络特征图，其中：1≤s≤L；L为主干网络的阶段数；S12，确定颈部网络：颈部网络的数学描述如下式所示：其中，gs·表示颈部网络g·；ф的第s层的函数，用于对Vs+1进行上采样，使得其与Vs的分辨率一致，Vs为第s层颈部网络特征图；Ф为颈部网络中每一层的可学习参数фs的集合；S13，判断主干网络类型，当主干网络为HiViT时，则进入步骤S2，否则将主干网络作为最终主干网络，进入S3；S2，对主干网络进行简化，用于使s＝1时计算出图像x的全局注意力；将简化后的主干网络作为最终主干网络，进入S3；S3，生成中间重建标签xs：利用教师主干网络来为所述图像x生成中间重建标签xs，如下式所示：其中，为教师主干网络的权重值；直接继承自公开的经过CLIP预训练过的模型；S4，确定多阶段损失函数l：构建多阶段损失函数l，包括掩码图像建模损失和掩码特征建模损失，如下式所示：其中，||x-hpt，0V||为掩码图像建模损失，hpt，0·为重建头函数；为掩码特征建模损失，用于补充所述掩码图像建模损失；γ为掩码特征建模损失系数；S5，构建待训练模型：使用所述最终主干网络、S1中的颈部网络和S4中的多阶段损失函数l构建待训练模型；S6，获取上游任务数据集和下游任务数据集：从公开的数据集中选取上游任务数据集来对所述待训练模型进行预训练；其中N为上游任务数据集中样本的总数量，n为上游任务数据集中样本编号；采集待应用现场的图像作为下游任务数据集其中M为下游任务数据集样本的总数量；m为下游任务数据集样本编号，是的标签；S7，对待训练模型进行训练：对S5中的待训练模型在所述上游任务数据集上进行训练，其中：训练完成得到预训练模型；S8，对预训练模型进行微调：使用S7得到的预训练模型在所述下游任务数据集上进行微调训练；当预训练模型训练至收敛时，得到并输出完成训练的模型；其中，hft﹒为检测头函数。

全文数据：

权利要求：

百度查询：苏州大成运和智能科技有限公司一种生成低迁移差距视觉自监督学习模型的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种蒸镀装置

下一篇：一种饲料包装机

相关技术

一种蒸镀装置

一种饲料包装机

一种具有母液回收功能的蒸发结晶装置

一种治疗心血管疾病的中药组合物

神经包埋辅助装置及其包埋方法

一种基于田间信息约束的农机定位方法

一种金属钛生产设备及金属钛生产方法

一种环形气瓶的多切点碳纤维缠绕装置

一种废旧电池回收系统及其回收方法

通话质量智能检测方法、装置及存储介质

一种用于轨道浮动对接的导轮定位装置

衣物的香薰方法、装置、设备及介质

视觉相关技术

基于因果引导视觉注意力表征视觉问答方法、介质及设备_合肥工业大学_202411310645.5

一种基于机器视觉的视觉功能检测系统_波克医疗科技(上海)有限公司_202411014570.6

一种工业视觉定位装置_武汉德中众惠智造科技有限公司_202420588164.X

视觉内容到音频轨道的同步_斯纳普公司_202280026550.3

激光视觉融合测量仪_重庆电子科技职业大学_202323334556.8

一种基于机器视觉的边缘偏移视觉测量方法、图像检测仪_菲特(天津)检测技术有限公司_202111133008.1

一种机器视觉方案智能生成方法_领湖智能(深圳)有限公司_202410013923.4

贴片机机器视觉传感器调节机构_杭州锐丰电子工业有限公司_202420052116.9

基于臂载视觉的小型穿越机器人_天津职业技术师范大学(中国职业培训指导教师进修中心)_202010912900.9

一种带有视觉检测功能的工业设备_瑞池伟业(北京)科技有限公司_202420474743.1

监督相关技术

一种半监督的红外图像分割方法_中国科学院自动化研究所_202410450421.8

一种弱监督的跨模态语义连贯性恢复方法_电子科技大学_202410938045.7

一种基于DETR的半监督医学图像目标检测方法_江苏济远医疗科技有限公司_202410852220.0

一种无监督域适应的点云学习方法_深圳技术大学_202410849266.7

一种面向时序数据的有监督地震监测方法及装置_浙江大学_202411321683.0

一种结合自监督机制的未知域轨迹预测方法_东南大学_202410870395.4

基于无监督异常检测和目标跟踪的地铁障碍物检测方法_中数智科(杭州)科技有限公司_202411112768.8

一种用于调水工程质量监督的垂直度检测装置_山东省水利科学研究院_202420625856.7

基于轨迹预测条件扩散模型的无监督骨架视频异常检测方法_安徽大学_202410805921.9

基于半监督与多模态融合的中央空调设备异常检测方法_山东浪潮智慧建筑科技有限公司_202410936712.8

差距相关技术

一种基于FPGA的大地水准面差距计算系统_浙江科技大学_202410988535.8

一种牵引机构及多差距变位的螺旋式缠绕捆绑装置_温州大学_202410962281.2

一种生成低迁移差距视觉自监督学习模型的方法_苏州大成运和智能科技有限公司_202410550135.9

一种架空齿轨车轨道温差距离调整用的衔接伸缩轨道_株洲中车特种装备科技有限公司_202323270799.X

一种基于协方差距离对生态环境多参数能力验证综合评价的方法_中国环境监测总站_202410136312.9

一种公路工程落差距离检测装置_王厚云_202322120493.X

一种基于操作路径差距的NPC控制方法、装置、设备及介质_广州三七极创网络科技有限公司_202311514408.6

一种医药企业六元差距指数智能评估方法和系统_四川大学华西医院_202311211762.1

一种架空齿轨车轨道温差距离调整方法及伸缩轨道_株洲中车特种装备科技有限公司_202311635391.X

用于解决由于操作者可变性导致的工业操作中的差距的系统和方法_施耐德电子系统美国股份有限公司_202180088387.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种生成低迁移差距视觉自监督学习模型的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务