Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜河南中烟工业有限责任公司周广旭获国家专利权

恭喜河南中烟工业有限责任公司周广旭获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜河南中烟工业有限责任公司申请的专利基于强化学习的虚拟无线传感网络资源分配方法、系统、电子设备及计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115243377B

龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210782127.8,技术领域涉及:H04W72/50;该发明授权基于强化学习的虚拟无线传感网络资源分配方法、系统、电子设备及计算机可读存储介质是由周广旭;郭越;李长进;侯俊峰;张红军;李松;王建涛;杨光设计研发完成,并于2022-06-30向国家知识产权局提交的专利申请。

基于强化学习的虚拟无线传感网络资源分配方法、系统、电子设备及计算机可读存储介质在说明书摘要公布了:本发明公开了基于强化学习的虚拟无线传感网络资源分配方法、系统、电子设备及计算机可读存储介质。从虚拟化无线传感网络的服务请求角度出发,提出了一种基于强化学习的虚拟化无线传感网络资源分配策略,首先建立基于业务感测信息质量要求和资源容量约束下的虚拟传感网络请求部署效用最大化模型;之后考虑到业务请求具有随机性且网络环境动态变化,将其资源优化问题转化为马尔科夫决策过程,最后采用基于进化算法的元学习强化学习算法与虚拟化无线传感网络环境不断交互以获得较优资源分配策略;该方法在满足资源需求的同时,有效提高了服务提供商收益,并降低了虚拟传感网络请求部署成本。

本发明授权基于强化学习的虚拟无线传感网络资源分配方法、系统、电子设备及计算机可读存储介质在权利要求书中公布了:1.一种基于强化学习的虚拟无线传感网络资源分配方法,其特征在于,所述方法包括:步骤S1、预先获取任一时刻到达的虚拟无线传感网络请求的所需资源需求;步骤S2、依据所述所需资源需求和预先建立的部署效用最大化模型从底层无线传感网络中选取候选物理节点集合,并根据所述候选物理节点集合得到相应的候选无线链路集合,其中,基于感测信息质量要求和资源需求约束条件预先建立所述部署效用最大化模型;步骤S3、将所述候选物理节点集合和所述候选无线链路集合代入马尔科夫决策模型,并利用强化学习算法从所述候选物理节点集合中选择一个候选物理节点作为最佳物理节点,并根据所述最佳物理节点从所述候选无线链路集合中选择相应的一个候选无线链路作为最佳无线链路,以为所述虚拟无线传感网络请求分配相应的通信带宽和传感器节点计算资源;在所述步骤S3之后还包括:步骤S4、将虚拟节点映射到强化学习算法选择的最佳物理节点上;在所述步骤S4中,如果所述虚拟节点成功映射到所述最佳物理节点上,则输出映射成功提示;如果所述虚拟节点未成功映射到所述最佳物理节点上,则从所述候选物理节点集合去除所述最佳物理节点,并判断所述虚拟节点的映射次数,如果所述映射次数大于预设次数阈值,则输出映射失败提示,如果所述映射次数小于所述预设次数阈值,则重新转入步骤S3;在所述步骤S2中,所述部署效用最大化模型的目标函数表示为:maxUt---1; 这里,表示业务请求感兴趣的区域位置坐标,crens表示节点处理能力阈值,brels表示系统资源的阈值,blv表示该虚拟链路对带宽资源的需求;此外,表示感测信息质量需求;d为感测区域位置之间的欧式距离,为服务请求距离阈值;进一步,c1表示在任意物理传感节点上由虚拟传感节点所占用的处理资源应小于该物理传感节点可用的处理资源;c2表示虚拟链路所占用的带宽资源应小于其对应物理链路的带宽资源;c3表示为感测信息质量要求;c4和c5表示变量的取值范围约束;目标函数为Ut=Rt-Ct,其中Rt和Ct分别表示其收益和成本;在所述步骤S3中,通过马尔科夫决策模型将虚拟无线传感网络请求定义为一个多元组M=S,A,P,R;其中S是状态空间,A是动作空间,P是转移概率,R是奖励函数,st∈S为时刻t的系统状态,包括虚拟无线传感网络请求的到达与离开、虚拟无线传感网络请求的所需资源需求以及当前底层无线传感网络的可用资源情况;动作at∈A为根据当前网络状态、传感节点处理和链路资源分配情况;在状态st执行动作at后,完成当前时刻虚拟无线传感网络请求的部署,此时得到一个立即回报Rt=Ut;状态转移概率prst+1∈St+1|st,at,表示在状态st下采取动作at转移至st+1的概率;在所述步骤S3中,所述强化学习算法为结合基于进化算法的元学习强化学习算法,通过设计内外两成循环,外层循环主要执行算法性能评估,从一堆的候选算法中选出获得的奖励回报最大的那一批算法;而内层循环主要执行算法筛选,把每种算法都训练到最好状态后,再利用外层循环进行性能评估,实现自动选出最优的虚拟无线传感网络资源分配算法。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河南中烟工业有限责任公司,其通讯地址为:450000 河南省郑州市郑东新区榆林南路16号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。