首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于分层强化学习的飞行器突防行为决策方法与系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西北工业大学

摘要:本发明涉及一种基于强化学习的突防方法,属于飞行器突防决策规划领域。本发明首先建立了突防飞行器及拦截飞行器的数学模型。其次,针对突防过程中存在的连续动作空间维度庞大的问题,结合分层参数化方法对动作空间进行设计。之后,设计相应的状态空间及奖励函数,建立完整的参数化动作马尔科夫决策过程;最终,基于所设计的分层强化学习方法求解突防决策指令。本发明采用分层参数化方法,对飞行器突防动作空间进行了分解,使得飞行器的突防动作服从典型机动策略,并选择合适的参数。并基于强化学习方法,学习最优突防策略及相对应的参数,实现成功突防。

主权项:1.一种基于分层强化学习的飞行器突防行为决策方法,其特征在于,包括以下步骤:根据突防飞行器及拦截飞行器的数学模型设计飞行器突防决策状态空间,所述飞行器突防决策状态空间用状态量及范围描述;结合分层参数化方法建立飞行器突防决策参数化动作空间;设计飞行器突防决策任务的奖励函数,最后得到参数化动作马尔科夫决策过程;结合强化方法学习参数化动作马尔科夫决策过程最优策略以及分层参数化方法更新策略,得到突防决策指令。

全文数据:

权利要求:

百度查询: 西北工业大学 一种基于分层强化学习的飞行器突防行为决策方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。