首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

内嵌数据处理单元的算力网络多域资源调度方法、系统、设备及存储介质 

申请/专利权人:北京邮电大学;国网北京市电力公司

申请日:2024-03-11

公开(公告)日:2024-06-28

公开(公告)号:CN118260071A

主分类号:G06F9/50

分类号:G06F9/50;G06N3/092;G06N3/084

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明提供一种内嵌数据处理单元的算力网络多域资源调度方法、系统、设备及存储介质,该方法包括:向集中式Critic控制器发送至少一个域内经验;域内经验包括第一状态数据、调度动作数据、奖励数据以及第二状态数据;第一状态数据为表征执行调度动作前域内算力资源状态的数据;调度动作数据为表征调度动作的数据;奖励数据为调度动作对应的奖励函数值;第二状态数据为表征在第一状态数据对应的算力资源状态下执行调度动作后域内算力资源状态的数据;接收集中式Critic控制器发送的策略更新信息;基于策略更新信息对本地策略网络进行更新得到更新后的本地策略网络;基于更新后的本地策略网络对当前任务进行算力调度。本发明能提高算力网络的调度效率。

主权项:1.一种内嵌数据处理单元的算力网络多域资源调度方法,其特征在于,应用于Actor-Critic框架下的分布式Actor控制器,所述分布式Actor控制器与集中式Critic控制器通信连接,所述方法包括:向所述集中式Critic控制器发送至少一个域内经验;所述域内经验包括第一状态数据、调度动作数据、奖励数据以及第二状态数据;所述第一状态数据为表征执行调度动作前域内算力资源状态的数据;所述调度动作数据为表征所述调度动作的数据;所述奖励数据为所述调度动作对应的奖励函数值;所述第二状态数据为表征在所述第一状态数据对应的算力资源状态下执行所述调度动作后域内算力资源状态的数据;接收所述集中式Critic控制器发送的策略更新信息,所述策略更新信息用于指导所述分布式Actor控制器更新所述分布式Actor控制器的本地策略网络;所述策略更新信息为所述集中式Critic控制器基于所述至少一个域内经验对所述集中式Critic控制器的全局策略网络进行深度强化学习得到的;基于所述策略更新信息对所述分布式Actor控制器的本地策略网络进行更新得到更新后的本地策略网络;基于所述更新后的本地策略网络对当前任务进行算力调度。

全文数据:

权利要求:

百度查询: 北京邮电大学;国网北京市电力公司 内嵌数据处理单元的算力网络多域资源调度方法、系统、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。