首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于贡献度度量的自适应微调方法及系统_贵州民族大学_202311744429.7 

申请/专利权人:贵州民族大学

申请日:2023-12-18

公开(公告)日:2024-06-14

公开(公告)号:CN118194924A

主分类号:G06N3/0464

分类号:G06N3/0464;G06N3/08;G06N3/006

优先权:

专利状态码:在审-公开

法律状态:2024.06.14#公开

摘要:本发明提供一种基于贡献度度量的自适应微调方法及系统,涉及参数微调技术领域;本发明通过粒子群优化PSO对预训练模型每层中的参数微调比例进行精确评估,得到适合目标任务的微调比例,通过度量预训练模型每层卷积层中的参数的贡献度,为微调参数的选择提供依据,并通过参数贡献度和最佳微调比例计算掩码矩阵,通过掩码矩阵对模型中的参数在目标训练数据上进行微调,得到微调后的训练模型。本发明实现了参数级的微调,使模型在不匹配目标任务和过拟合目标任务间达到了平衡,通过少量的训练时间显著提升了模型在目标任务上的性能。

主权项:1.一种基于贡献度度量的自适应微调方法,其特征在于,包括如下步骤:S1、导入预训练模型,所述预训练模型包括多层卷积层,每层卷积层包括多个参数;S2、通过粒子群优化PSO对每层中多个参数进行微调评估,得到多个候选解;S3、通过贡献度度量准则对每层卷积层的多个参数进行度量,得到每层卷积层中多个参数对应的贡献度,通过多个所述候选解分别对每层卷积层的多个参数对应的贡献度进行计算,得到多个初始掩码矩阵,按照第一预设周期对所述预训练模型分别与多个所述初始掩码矩阵进行调参计算,得到多个初始微调训练模型,将预设目标数据集分别输入多个所述初始微调训练模型中进行计算,得到多个适应度值;S4、通过多个所述适应度值更新多个所述候选解,直至满足预设迭代次数,根据更新后的多个候选解得到最优解;S5、通过所述最优解对每层卷积层的多个参数对应的贡献度进行计算,得到掩码矩阵,按照第二预设周期对所述预训练模型与所述掩码矩阵进行调参计算,得到微调训练模型。

全文数据:

权利要求:

百度查询: 贵州民族大学 一种基于贡献度度量的自适应微调方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。