Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度强化学习的多分割多跳任务卸载系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南希赛网络科技有限公司

摘要:本发明公开了一种基于深度强化学习的多分割多跳任务卸载系统,本发明涉及无线网络资源分配技术领域,解决了最小化所有服务物联网设备的平均能耗并满足其任务截止时间的长期优化的技术问题,本发明通过多跳通信传输到远程的边缘服务器。此外,本发明使物联网设备能够将其数据分成多个片段,每个片段被分配一个任务执行路径,从直接连接到某物联网设备的边缘服务器到负责处理该特定任务数据段的边缘服务器,可以根据边缘服务器之间的网速,自适应地调节多跳的步数,以及数据切割的块数,对边缘服务器的负载均衡有很大提升,能够增加计算网络的吞吐量。

主权项:1.一种基于深度强化学习的多分割多跳任务卸载系统,其特征在于,包括:信息采集模块,用于将获取的时间尺度信息传输到优化时间划分模块;优化时间划分模块,用于对获取的时间尺度信息进行分析,通过对时间线进行划分得到多组时间段,并对时间段进行划分得到时间槽,同时对时间槽进行训练阶段q1和执行阶段q2的划分,接着进行多跳多切割以及资源分配的处理得到数据块,并将数据块传输到自适应处理分析模块,且对时间线进行划分的具体方式如下:获取时间尺度信息中的时间线,将时间线划分为大时间段且标号为i,且i=1、2、…、i1,且i1为正整数,接着对时间段i进行时间槽的划分并标号记作t,且t=1、2、…、g,且g为正整数;接着将时间槽g进行训练阶段q1和执行阶段q2的划分,且训练阶段q1的长度记为Z,执行阶段q1的长度记为-Z,且表示执行阶段的时间长度,系统在训练阶段q1会寻找高质量的多跳多切割以及资源分配方案,并在训练阶段结束的时候选择一个最佳方案,且在执行阶段q2,则会执行最佳方案;任务特征计算单元,用于对物联网设备执行的计算任务特征进行计算,计算得到任务特征的具体方式如下:将第n个物联网设备要执行的计算任务的数据量记作,将计算复杂度记作,并使用进行表示,将任务的执行期限记作Ln,将物联网设备的ID表示为,且n表示第n个物联网设备;保持每个时间段T内的不变,每个任务需要再时间内完成并将计算得到的时间作为任务特征,同时生成任务特征信息;子任务执行单元,用于对子任务进行传输路径进行分析,并生成路径传输信息,且生成路径传输信息的具体方式如下:对边缘服务器的ID进行表示记作,且h表示第h个边缘服务器,同时对每个物联网设备n的计算任务数据进行切割得到数据块,且每个数据块对应一个边缘服务器的子任务,接着对应单个子任务,构建一个数据多跳传输路径,行生成路径传输信息;自适应处理分析模块,用于对获取的数据块进行DRL代理分配得到分配信息,同时对PPO网络的状态、网络的动作和网络的奖励进行定义,同时根据物联网设备的参数来对数据段进行路径构建,并应用次梯度方法推导出边缘服务器的最优资源分配策略,并配置物联网设备的最优本地计算速度和传输功率生成处理结果,接着将处理结果传输到处理结果输出模块,且对PPO网络的状态、网络的动作和网络的奖励的具体定义方式为:对网络的状态定义: ;且PPO网络状态中的关系式从上到下分别表示该物联网设备在时间戳t内,与边缘服务器的位置、边缘服务器可用的计算资源和网络资源数量、与各个边缘服务器连接情况、数据切割情况、计算任务特征、网络传输功率和计算功率、服务器分配给物联网设备的计算资源数量和网络资源分配情况、任务完成时长和物联网设备能耗、任务完成度;PPO网络的动作定义为:;且从上到下分别表示与各个边缘服务器连接选择和数据切割,设置一个变量K来限制数据可以被切割的最大次数,然后根据的大小来对边缘服务器排序,并选择最大的K个边缘服务器,最后将中第k+1个数据块分配给排在中的第k位的边缘服务器进行远程计算;PPO网络的奖励(reward)被定义为:其中代表第n个物联网设备的能耗,表示整个系统的任务完成度;综合定义的PPO网络的状态、网络的动作和网络的奖励,将数据块带入DRL代理得到分配信息;处理结果输出模块,用于将获取的处理结果显示给操作人员。

全文数据:

权利要求:

百度查询: 湖南希赛网络科技有限公司 一种基于深度强化学习的多分割多跳任务卸载系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。