【发明公布】一种基于视觉大模型的提示微调方法_浙江工业大学_202410422320.X

导航：龙图腾网> 最新专利技术> 一种基于视觉大模型的提示微调方法_浙江工业大学_202410422320.X

申请/专利权人：浙江工业大学

申请日：2024-04-09

公开（公告）日：2024-06-07

公开（公告）号：CN118155045A

主分类号：G06V10/82

分类号：G06V10/82;G06V10/764;G06N3/0464;G06N3/08

优先权：

专利状态码：在审-公开

法律状态：2024.06.07#公开

摘要：本发明属于图像处理技术领域，具体涉及一种基于视觉大模型的提示微调方法。本发明包括：构建骨干网络，保存主干参数，将数据增强处理后的图像数据集中的图像处理为输入向量集，输入编码器层；添加提示向量为骨干网络的参数，根据需要训练的参数量选择浅层参数微调方式或深层参数微调方式；将骨干网络第N层编码器层输出的分类令牌输入解码器中，得到预测结果；根据预测结果和真实结果计算损失值，根据损失值进行反向传播，更新提示向量，训练预设轮次后得到训练好的骨干网络；使用训练好的骨干网络进行预测。本发明通过冻结模型主干参数，并且在输入空间中添加少量的可训练的参数，缩短了微调训练过程，降低了模型在下游任务中的训练成本。

主权项：1.一种基于视觉大模型的提示微调方法，其特征在于，所述基于视觉大模型的提示微调方法，包括：获取图像数据集，对图像数据集进行预处理，并进行数据增强处理；构建并预训练骨干网络得到预训练好的骨干网络，并保存训练参数，所述骨干网络包括N层编码器层和解码器，用公式表示为：[xi，Ei]＝Li[xi-1，Ei-1]i＝1，2，...，Ny＝HeadxN其中，表xi示第i层编码器层输出的值，x0表示输入第一层编码器层的令牌，Ei表示第i+1层编码器层的输入向量集，EN表示第N层编码器层输出的最终向量集，Li表示第i层编码器层，xi-1表示第i-1层编码器层输出的值，Ei-1表示第i层编码器层的输入向量集，Head表示解码器，xN表示第N层编码器层输出的值，y表示解码器输出的预测结果；将数据增强处理后的图像数据集中的图像处理为输入向量集，输入编码器层；添加提示向量为骨干网络的参数，根据需要训练的提示向量的数量选择浅层参数微调方式或深层参数微调方式，初始化提示向量并将提示向量输入编码器层，所述浅层参数微调方式为只将提示向量输入第一层编码器层L1，用公式表示如下：[x1，Z1，E1]＝L1[x0，P，E0][xi，Zi，Ei]＝Li[xi-1，Zi-1，Ei-1]i＝2，3，...，Ny＝HeadxN其中，x1表示第一层编码器层输出的值，Z1表示第一层编码器层计算的提示向量的特征，E1表示第二层编码器层的输入向量集，P表示提示向量集合，E0表示第一层编码器层的输入向量集，Zi∈Rt×d表示第i个编码器层计算的提示向量的特征，t表示提示向量的个数，d表示提示向量的维数，Zi-1表示第i一1个编码器层计算的提示向量的特征；所述深层参数微调方式为提示向量初始化后被输入到每个编码器层中，用公式表示如下：[xi，-，Ei]＝Li[xi-1，Pi-1，Ei-1]i＝1，2，...，Ny＝HeadxN其中，Pi-1表示输入第i个编码器层的提示向量集合；将骨干网络第N层编码器层输出的值输入解码器中，得到预测结果；根据预测结果和真实结果计算损失值，根据损失值进行反向传播，更新提示向量，训练预设轮次后得到训练好的骨干网络；使用训练好的骨干网络进行预测。

全文数据：

权利要求：

百度查询：浙江工业大学一种基于视觉大模型的提示微调方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种油烟机组件联动装置及油烟机_宁波方太厨具有限公司_202410203848.8

下一篇：一种建筑工程语义模型的构建方法、系统、设备及介质_中设数字技术有限公司_202410314233.2

相关技术

一种油烟机组件联动装置及油烟机_宁波方太厨具有限公司_202410203848.8

一种建筑工程语义模型的构建方法、系统、设备及介质_中设数字技术有限公司_202410314233.2

一种暖通空调风管连接结构_天津建工城市建设发展有限公司_202410458760.0

一种基于北斗导航定位的高空探测系统_南京大桥机器有限公司_202410282128.5

一种电池粉回收提锂制备电池级碳酸锂的方法_荆门动力电池再生技术有限公司_202410379260.8

一种基于地面和在轨数据的微波辐射计在轨定标方法_中国科学院国家空间科学中心_202410421074.6

一种使用编码器测量出水高度的无人水翼航行器_中国船舶集团有限公司第七六O研究所_202410247188.3

基于目标检测模型的危废工厂安全隐患检测方法及系统_光大环境科技(中国)有限公司_202410306128.4

一种基于电网信息模型的建模处理方法、装置和设备_内蒙古电力勘测设计院有限责任公司_202410384399.1

一种30Mn2方钢轨道的闪光对焊焊接方法_上海振华重工(集团)股份有限公司_202410465824.X

一种新型磁弹簧准零刚度阻尼减振刀具_松德刀具(长兴)科技有限公司_202410459890.6

一种热减粘胶水及其制备方法和热减粘压敏胶带及其制备方法_惠州市美信电子有限公司_202410386665.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于视觉大模型的提示微调方法_浙江工业大学_202410422320.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务