首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于联邦学习的工业异构设备多作业调度方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:重庆理工大学

摘要:本发明提出了一种基于联邦学习的工业异构设备多作业调度方法,包括以下步骤:S1,将多作业面向实际边缘网络的优化问题描述为以下的优化问题公式:S2,将优化问题公式建模为Dec‑POMDP模型,所涉及到的参数包括:S、A、O、R、P;S3,采用联邦多作业调度算法FMJS求解Dec‑POMDP模型,得到调度策略。本发明能够在异构的分布式工业环境下平衡各个工业客户端被调度至联邦作业的次数,以保证工业客户端被公平和高效率地调度,模型最终可高效收敛;此外,面向工业制造的边缘智能网络是一个多变的网络环境,不仅仅是网络状态本身的变化,工业客户端本地的数据面向时间也在不断变化,本发明方法能调度状态最佳的设备参与联邦作业,从而获得更好的模型性能,为各类工业应用提供更优化的模型决策支持。

主权项:1.一种基于联邦学习的工业异构设备多作业调度方法,其特征在于,包括以下步骤:S1,将多作业面向实际边缘网络的优化问题描述为以下的优化问题公式: 其中表示作业j在r轮对应的值函数;ψ1和ψ2均为常数,用于衡量两项指标的权重; 表示由工业客户端参与作业j的时间敏感度; 表示由工业客户端参与作业j的工作积极性;且在任意训练轮次r中,满足以下限制条件: 其中Lj表示作业j给定的损失值; 表示作业j所对应的全局损失函数; 表示作业集合; 表示索引为n的工业客户端在第r轮中是否参与作业j的执行;N表示总的训练轮次数;J表示作业总数量;S2,将优化问题公式建模为Dec-POMDP模型,所涉及到的参数包括:S、A、O、R、P,其中S为各智能体的状态集集合表示,A为多智能体的联合动作集合,O为智能体的观察集合,R为多智能体系统的整体奖励,P为环境的状态转移概率;S3,采用联邦多作业调度算法FMJS求解Dec-POMDP模型,得到调度策略;联邦多作业调度算法FMJS包括以下步骤:将各个联邦作业抽象为多个智能体,分别执行对应的智能体网络,该网络的输入为智能体的观测值On,r和上一轮次的动作An,r-1,输出为对应智能体的值函数Qn;其中On,r表示第n个智能体,第r轮次的观测值,Qn为强化学习中的值函数;所述智能体网络依次由FC全连接网络层、GRU门控制单元、FC全连接网络层构成;将智能体网络的输出与多作业环境相关的数据存入经验记忆库,同时通过智能体网络的输出计算奖励值,并将计算得到的奖励值存入经验记忆库;然后经过混合网络对当前分布式的智能体值函数以及经验记忆库的经验数据进行合并,并将合并后的函数值输入到智能体网络中;重复上述步骤,直到达到设置的训练轮次数时,混合网络输出函数,经过上述过程训练完成的调度器可根据当前的工业异构设备系统状态为相应作业调度合适的工业客户端,参与单个联邦学习任务。

全文数据:

权利要求:

百度查询: 重庆理工大学 一种基于联邦学习的工业异构设备多作业调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。