首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于先验知识的双动作强化学习频谱接入方法和系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军国防科技大学

摘要:本发明公开了一种基于先验知识的双动作强化学习频谱接入方法和系统,属于电磁频谱技术领域。所述方法对先验知识进行评价筛选,初始化Q表,确认当前状态;进行Q学习,首先将动作空间分解为二维,其中一维动作定义为智能体选择的信道,另一维动作定义为接入信道的时隙数,按维度依次进行动作选择;然后根据动作选择结果,进行频谱接入;最后结合偏向信息更新Q表,所述偏向信息为奖励值。所述系统用于实现所提出的方法。本发明的方法具有较好的性能,能够提高频谱接入的效率。

主权项:1.一种基于先验知识的双动作强化学习频谱接入方法,其特征在于,包括:对先验知识进行评价筛选,初始化Q表,确认当前状态,任一时刻的状态包括:每个信道前两个时隙的差值以及均值;进行Q学习,首先将动作空间分解为二维,其中一维动作定义为智能体选择的信道,另一维动作定义为接入信道的时隙数,按维度依次进行动作选择;然后根据动作选择结果,进行频谱接入;最后结合偏向信息更新Q表,所述偏向信息为奖励值;所述对先验知识进行评价筛选的方法为:根据皮尔逊相关系数定义先验知识的准确度,并选择准确度高的信息作为先验信息;利用皮尔逊积矩相关系数,衡量两个变量之间的线性相关性,公式如下: 其中,μX和μY分别为变量X和Y的均值,σX和σY分别为X和Y的标准差;先验知识相似度ρ定义如下: 其中,X和Y为待对比的不同矩阵,QXi和QYi为状态i下的二维Q矩阵Qa1,a2,其中,a1和a2分别为两个维度的动作;在频谱接入时,选择相似度最高的先验知识。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 基于先验知识的双动作强化学习频谱接入方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。