内嵌数据处理单元的算力网络多域资源调度方法、系统、设备及存储介质

导航：龙图腾网> 最新专利技术> 内嵌数据处理单元的算力网络多域资源调度方法、系统、设备及存储介质

申请/专利权人：北京邮电大学;国网北京市电力公司

申请日：2024-03-11

公开（公告）日：2024-06-28

公开（公告）号：CN118260071A

主分类号：G06F9/50

分类号：G06F9/50;G06N3/092;G06N3/084

优先权：

专利状态码：在审-公开

法律状态：2024.06.28#公开

摘要：本发明提供一种内嵌数据处理单元的算力网络多域资源调度方法、系统、设备及存储介质，该方法包括：向集中式Critic控制器发送至少一个域内经验；域内经验包括第一状态数据、调度动作数据、奖励数据以及第二状态数据；第一状态数据为表征执行调度动作前域内算力资源状态的数据；调度动作数据为表征调度动作的数据；奖励数据为调度动作对应的奖励函数值；第二状态数据为表征在第一状态数据对应的算力资源状态下执行调度动作后域内算力资源状态的数据；接收集中式Critic控制器发送的策略更新信息；基于策略更新信息对本地策略网络进行更新得到更新后的本地策略网络；基于更新后的本地策略网络对当前任务进行算力调度。本发明能提高算力网络的调度效率。

主权项：1.一种内嵌数据处理单元的算力网络多域资源调度方法，其特征在于，应用于Actor-Critic框架下的分布式Actor控制器，所述分布式Actor控制器与集中式Critic控制器通信连接，所述方法包括：向所述集中式Critic控制器发送至少一个域内经验；所述域内经验包括第一状态数据、调度动作数据、奖励数据以及第二状态数据；所述第一状态数据为表征执行调度动作前域内算力资源状态的数据；所述调度动作数据为表征所述调度动作的数据；所述奖励数据为所述调度动作对应的奖励函数值；所述第二状态数据为表征在所述第一状态数据对应的算力资源状态下执行所述调度动作后域内算力资源状态的数据；接收所述集中式Critic控制器发送的策略更新信息，所述策略更新信息用于指导所述分布式Actor控制器更新所述分布式Actor控制器的本地策略网络；所述策略更新信息为所述集中式Critic控制器基于所述至少一个域内经验对所述集中式Critic控制器的全局策略网络进行深度强化学习得到的；基于所述策略更新信息对所述分布式Actor控制器的本地策略网络进行更新得到更新后的本地策略网络；基于所述更新后的本地策略网络对当前任务进行算力调度。

全文数据：

权利要求：

百度查询：北京邮电大学;国网北京市电力公司内嵌数据处理单元的算力网络多域资源调度方法、系统、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种圆管弯曲成型装置

下一篇：一种宽度紧凑型半导体封装结构

相关技术

一种圆管弯曲成型装置

一种宽度紧凑型半导体封装结构

一种防滑型无纺布的裁剪装置

一种新型预制电力排管

电池包充电器

一种新型全遮光窗帘面料

一种巡检方便的电容补偿柜

一种仓库物资搬运装置

一种生态护坡绿化模块

一种低交叉极化抑制的宽带UWB天线及穿戴设备

一种NB模组驱动的摄像采集装置

一种实时监测并控制化锡线硫化氢气体的装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

内嵌数据处理单元的算力网络多域资源调度方法、系统、设备及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务