Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种安全领域大模型微调方法、装置及可读储存介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国电子科技集团公司第三十研究所

摘要:本发明公开了一种安全领域大模型微调方法、装置及可读储存介质,涉及人工智能大模型领域,本发明,受牵制控制启发,将控制领域牵制控制思想引入大模型微调阶段训练,尝试解决通用大模型预训练数据集与领域大模型微调数据集之间的数据差异问题,提升大模型微调泛化性。同时,受联邦学习启发,提出一种模型参数融合机制,以参数的形式扩增微调数据集,在解决数据集不平衡问题的同时提升模型输出的鲁棒性。

主权项:1.一种安全领域大模型微调方法,其特征在于,包括:步骤S1:受牵制控制的启发,构造大模型网络动态系统表示;步骤S2:从牵制控制角度推演大模型微调阶段冻结微调约束条件;步骤S3:选择满足步骤S2约束条件下的微调阶段冻结方案,受联邦学习启发,各客户端用各个事件数据集分别微调预训练模型,将各个模型的参数集合上传至服务端进行融合操作,获得第一次全局大模型参数集合;步骤S4:服务端将融合后的参数下发至各个客户端,根据步骤S2的受控条件增加冻结节点或参数的数量,再次微调;步骤S5:将各个参数集合上传至服务端进行融合操作,获得第二次全局大模型参数集合,若模型未收敛或性能指标未达预设标准,继续迭代融合;当训练达到预设的前提条件时,融合迭代结束,输出大模型参数集合;所述步骤S2,包括:假设以的比例冻结网络中的层数或者参数,为微调层数或参数,;则,网络状态方程为: 其中: 表示受控层或参数数量为的网络状态动态表示; 表示受控层或参数数量为的网络Laplacian矩阵的元素; 表示控制输入或受控增益,是控制输入或受控增益; 表示受控层或参数数量为的网络状态;大模型微调场景中对非受控层或参数采取冻结操作,即保留预训练数值,不参与微调阶段反馈计算,则有: 当节点自动态和耦合强度给定时,用从网络的Laplacian矩阵中删除固定节点对应的行和列得到的groundedLaplacian的最小特征根来衡量控制方案的有效性,即最小特征根越大,控制方案越有效;在大模型微调场景中,设受控,即层或参数参与微调阶段反馈计算,令是依据冻结策略删除冻结层或参数,对应的行-列对而来的缩减矩阵;则,若下式成立受控网络可达到同步状态: 其中,,用以保证构造矩阵是M矩阵,M矩阵具有非正对角元素的非奇异矩阵,其逆矩阵的所有元素都是非负的;是特征根的最小实部,其下界由SchurComplement可得: 其中,为微调层或微调参数的权重系数;为受控层或参数集合与不受控层与参数集合之间的最大距离;在大模型微调场景中,冻结微调的策略是否有效可以从两个方面来评估:微调层或微调参数的权重系数和受控层或参数集合与不受控层与参数集合之间的最大距离。

全文数据:

权利要求:

百度查询: 中国电子科技集团公司第三十研究所 一种安全领域大模型微调方法、装置及可读储存介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。