首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于SAC算法的随机接入ACB因子优化方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子科技大学;重庆邮电大学空间通信研究院

摘要:本发明公开了一种基于SAC算法的随机接入ACB因子优化方法,属于通信技术领域。本发明通过软演员评论家方法解决随机接入过程中的拥塞控制问题,在拥塞控制过程中,采用利用强化学习方法确定当前的接入等级限制因子和ACB回退空间,保证随机接入过程的有序进行,避免发生比较严重的拥塞现象。在出现大量用户集中发生随机接入造成通信拥塞的场景下采用本发明方法,可以对ACB因子的大小和回退空间进行动态规划,在不同的时隙上采用不同的ACB策略,相比于其他方法,本发明方法需要的先验信息更少,收敛更快,可以建立比较好的随机接入拥塞控制策略。

主权项:1.一种基于SAC算法的随机接入ACB因子优化方法,其特征在于,包括下列步骤:步骤1,采用双队列模型对随机接入过程中的拥塞情况进行模拟,以采集不同决策下的随机接入状态数据,得到训练数据集;其中,随机接入状态数据包括:随机接入成功次数,随机接入失败次数,随机接入过程发生超时的设备数;步骤2,采用基于深度强化学习的软演员-评论家神经网络,建立用于随机接入过程的拥塞控制决策的网络模型,该网络模型包括若干个价值函数、若干目标网络和一个决策网络;其中,各目标网络的网络结构相同,且价值函数与目标网络一一对应;所述网络模型的强化学习的奖励函数返回的奖励值为随机接入成功次数;所述网络模型的强化学习的状态空间的状态空间观测值包括:上一时隙的随机接入成功数,随机接入失败数,以及随机接入过程发生超时的设备数;所述网络模型的强化学习的动作空间的对象包括:家ACB因子,ACB回退窗口尺寸;步骤3,基于训练数据集对步骤2构建的网络模型参数进行训练更新,当满足预置的收敛条件时,得到训练好的用于随机接入过程的拥塞控制决策的网络模型。

全文数据:

权利要求:

百度查询: 电子科技大学 重庆邮电大学空间通信研究院 一种基于SAC算法的随机接入ACB因子优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。