买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国电子科技集团公司第七研究所
摘要:本发明公开了一种面向切片的低时延无线资源调度方法及系统,其中方法步骤如下:接收物理世界用户发送的资源调度请求信息;基于当前接收到的资源调度请求信息,获取用户的瞬时传输速率;通过可用的计算资源构建用户资源分配的数字孪生模拟环境;在数字孪生模拟环境中,结合用户的瞬时传输速率、现有可用的计算资源、用户的调度请求信息计算每个用户在每个资源块上的优先级,初步评估资源块的分配决策;基于用户的历史分配数据,通过深度确定性策略迭代模型对初步评估资源块的分配决策进行优化;根据优化后的分配决策完成对用户的资源块分配,并将分配决策映射到物理世界。
主权项:1.一种面向切片的低时延无线资源调度方法,其特征在于:所述的方法包括步骤如下:接收物理世界用户发送的资源调度请求信息;基于当前接收到的资源调度请求信息,获取用户的瞬时传输速率;通过现有可用的计算资源构建用户资源分配的数字孪生模拟环境;在数字孪生模拟环境中,结合用户的瞬时传输速率、现有可用的计算资源、用户的调度请求信息计算每个用户在每个资源块上的优先级,初步评估资源块的分配决策;基于用户的历史分配数据,通过深度确定性策略迭代模型对初步评估资源块的分配决策进行优化;根据优化后的分配决策完成对用户的资源块分配,并将分配决策映射到物理世界;其中,所述的深度确定性策略迭代模型包括Actor神经网络、Critic神经网络;将当前的资源调度请求信息作为观测信息并定义为,将历史分配数据放入构建的replaymemory中;将当前的资源调度请求信息输入Actor神经网络中获取对应的资源分配决策,并且通过给定的优先级公式计算对应的reward值;以及,将当前的资源调度请求信息输入Actor神经网络进行迭代训练,在迭代多次后,其reward考虑记忆的折扣能够重写为: 其中,表示用户i获得的奖赏,表示折扣因子;T表示时间尺度;以及,基于获取对应的资源块分配策略,建立行为值函数去表述在采取该资源块分配策略后所期望得到的回报,该行为值函数表示为: 式中,为期望函数;以及,针对建立行为值函数去表述在采取资源块分配策略后所期望得到的回报,通过构建loss函数来获取最大的期望回报,所述的loss函数表示为: 其中,表示函数的参数近似,表示用户的真实需求回报,为期望函数。
全文数据:
权利要求:
百度查询: 中国电子科技集团公司第七研究所 一种面向切片的低时延无线资源调度方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。