首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度强化学习的求解组合优化问题的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军国防科技大学

摘要:本发明实施例提供一种基于深度强化学习的求解组合优化问题的方法,包括:对组合优化问题建模成原图;采用强化学习模型对原图进行探索,得到原图当前最优解及原图当前最优节点状态;对原图当前最优节点状态进行GT,得到GT图;采用强化学习模型对GT图进行探索,得到GT图最优解及GT图最优节点状态;对GT图最优节点状态进行逆GT,得到逆GT后节点状态;在原图中探索逆GT后节点状态对应的最优解,得到逆GT原图最优解;判断逆GT原图最优解是否大于原图当前最优解;若是,则对GT图最优节点状态进行再次GT,以再次GT后得到的结果更新GT图,继续进行GT;若否,则以逆GT原图最优解作为组合优化问题的全局最优解。从而解决当前RL难以得到组合优化问题的全局最优解的问题。

主权项:1.一种基于深度强化学习的求解组合优化问题的方法,其特征在于,包括:S1、对组合优化问题建模成原图,所述原图包含多个节点及多条边;S2、采用强化学习模型对所述原图进行探索,得到原图当前最优解及对应的原图当前最优节点状态;S3、对所述原图当前最优节点状态进行GT变换,得到GT图;S4、采用所述强化学习模型对所述GT图进行探索,得到GT图最优解及对应的GT图最优节点状态;S5、对所述GT图最优节点状态进行逆GT变换,得到逆GT后节点状态;S6、在所述原图中探索所述逆GT后节点状态对应的最优解,得到逆GT原图最优解;S7、判断所述逆GT原图最优解是否大于所述原图当前最优解;S8、若是,则对所述GT图最优节点状态进行再次GT变换,以再次GT变换后得到的结果更新所述GT图,并返回S4;S9、若否,则以所述逆GT原图最优解作为所述组合优化问题的全局最优解。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 一种基于深度强化学习的求解组合优化问题的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。