一种安全领域大模型微调方法、装置及可读储存介质

导航：龙图腾网> 最新专利技术> 一种安全领域大模型微调方法、装置及可读储存介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国电子科技集团公司第三十研究所

摘要：本发明公开了一种安全领域大模型微调方法、装置及可读储存介质，涉及人工智能大模型领域，本发明，受牵制控制启发，将控制领域牵制控制思想引入大模型微调阶段训练，尝试解决通用大模型预训练数据集与领域大模型微调数据集之间的数据差异问题，提升大模型微调泛化性。同时，受联邦学习启发，提出一种模型参数融合机制，以参数的形式扩增微调数据集，在解决数据集不平衡问题的同时提升模型输出的鲁棒性。

主权项：1.一种安全领域大模型微调方法，其特征在于，包括：步骤S1：受牵制控制的启发，构造大模型网络动态系统表示；步骤S2：从牵制控制角度推演大模型微调阶段冻结微调约束条件；步骤S3：选择满足步骤S2约束条件下的微调阶段冻结方案，受联邦学习启发，各客户端用各个事件数据集分别微调预训练模型，将各个模型的参数集合上传至服务端进行融合操作，获得第一次全局大模型参数集合；步骤S4：服务端将融合后的参数下发至各个客户端，根据步骤S2的受控条件增加冻结节点或参数的数量，再次微调；步骤S5：将各个参数集合上传至服务端进行融合操作，获得第二次全局大模型参数集合，若模型未收敛或性能指标未达预设标准，继续迭代融合；当训练达到预设的前提条件时，融合迭代结束，输出大模型参数集合；所述步骤S2，包括：假设以的比例冻结网络中的层数或者参数，为微调层数或参数，；则，网络状态方程为：其中：表示受控层或参数数量为的网络状态动态表示；表示受控层或参数数量为的网络Laplacian矩阵的元素；表示控制输入或受控增益，是控制输入或受控增益；表示受控层或参数数量为的网络状态；大模型微调场景中对非受控层或参数采取冻结操作，即保留预训练数值，不参与微调阶段反馈计算，则有：当节点自动态和耦合强度给定时，用从网络的Laplacian矩阵中删除固定节点对应的行和列得到的groundedLaplacian的最小特征根来衡量控制方案的有效性，即最小特征根越大，控制方案越有效；在大模型微调场景中，设受控，即层或参数参与微调阶段反馈计算，令是依据冻结策略删除冻结层或参数，对应的行-列对而来的缩减矩阵；则，若下式成立受控网络可达到同步状态：其中，，用以保证构造矩阵是M矩阵，M矩阵具有非正对角元素的非奇异矩阵，其逆矩阵的所有元素都是非负的；是特征根的最小实部，其下界由SchurComplement可得：其中，为微调层或微调参数的权重系数；为受控层或参数集合与不受控层与参数集合之间的最大距离；在大模型微调场景中，冻结微调的策略是否有效可以从两个方面来评估：微调层或微调参数的权重系数和受控层或参数集合与不受控层与参数集合之间的最大距离。

全文数据：

权利要求：

百度查询：中国电子科技集团公司第三十研究所一种安全领域大模型微调方法、装置及可读储存介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于GLSL ES的图像渲染方法及装置

下一篇：基于深度表示的风电机组异常检测方法

相关技术

一种基于GLSL ES的图像渲染方法及装置

基于深度表示的风电机组异常检测方法

显示装置

一种抛光液供给装置和化学机械抛光设备

一种用于快速生产面包的组合物及其应用

一种烧结混合料的定质量取样系统及方法

测定气氛烧结炉内气氛一致性的方法

一种流量控制阀

近红外线吸收玻璃及近红外线截止滤光片

一种叶轮自吸冷却的磁悬浮风机

包裹暴力分拣的检测方法、装置、计算机设备和存储介质

一种托辊式管状带式输送机

方法相关技术

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300028.7

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300300.1

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300008.X

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300022.X

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300032.3

基板干燥方法与基板处理方法_株式会社斯库林集团_202380029428.6

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300005.6

切割方法_盐城高测新能源科技有限公司_202310504079.0

治疗方法_沃卢申伊缪诺制药公司_202080046367.0

轮胎安装方法、轮胎加工方法和轮胎保持装置_株式会社普利司通_202380027171.0

微调相关技术

门窗加工用锁紧微调结构及移动平台_山东九屹智能科技有限公司_202323666224.X

一种可微调节弯管夹模_奥美森智能装备股份有限公司_202411208351.1

基于运行时微调生成心理咨询师风格回答的方法_北京工业大学_202410727201.5

一种用于非接触式模具抽芯行程开关的微调结构_重庆厉璟智能装备有限公司_202420142073.3

基于语音大模型微调的旋转机械故障预警诊断方法_北京化工大学_202411137477.4

一种可微调摄像头安装角度的摄像装置_深圳市昂星科技有限公司_202420832492.X

大模型微调方法、装置、电子设备、存储介质和程序产品_摩尔线程智能科技(北京)有限责任公司_202410329948.5

具有间隙自适应微调功能的晶圆自动理片器_兴宇宏半导体科技(苏州)有限公司_202411004565.7

基于大语言模型提示微调的招标文件半结构自动生成方法和装置_曹琼瑶_202410793037.8

换热器底座的微调机构_大冶市守信机械制造有限公司_202323559691.2

装置相关技术

电池装置及用电装置_宁德时代新能源科技股份有限公司_202422013222.9

用户装置及基站装置_株式会社NTT都科摩_201880093260.4

场景判断方法及装置、电子装置_浙江大华技术股份有限公司_202011043222.3

判定装置以及控制装置_发那科株式会社_202280093362.2

一种电气装置展示装置_国网浙江省电力有限公司浦江县供电公司_202410899564.7

显示装置及其光源装置_三星电子株式会社_202380025155.8

电池单体、电池装置和用电装置_宁德时代新能源科技股份有限公司_202411375930.5

SCR脱硝装置的导流装置_句容台泥水泥有限公司_202322925153.4

栽培装置控制方法及栽培装置_中国农业大学_202411333839.7

用于制造显示装置的装置_三星显示有限公司_202420396838.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种安全领域大模型微调方法、装置及可读储存介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务