首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

面向仿真推演的任务规划方法、装置、介质及程序产品 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:厦门渊亭信息科技有限公司

摘要:本发明提供了一种面向仿真推演的任务规划方法、装置、介质及程序产品,该方法包括:S1,设计作战任务模型,定义任务结束条件、动作集、状态集、回报函数和目标函数;S2,建立作战任务规划的仿真推演环境;S3,把作战任务分解成一系列并行的作战单元执行的子任务;S4,构建层次化决策框架,其中,所述层次化决策框架分为高层次决策框架和低层次决策框架;S5,训练作战任务规划神经网络模型并构建作战任务规划系统。利用上述技术方案,可以实现现代战役中对于作战任务规划的实时性和精确性的要求。

主权项:1.一种面向仿真推演的任务规划方法,其特征在于,基于选项的多层强化学习算法来实现任务规划,包括以下步骤:S1,设计作战任务模型,定义作战任务结束条件、动作集、状态集、回报函数和目标函数,其中,所述作战任务模型为无人机群作战任务模型,所述无人机群作战任务模型为基于马尔科夫决策过程MDP的数学模型;所述作战任务结束条件为达到预先设定好的作战任务结束时间或无人机群在指定时间内完成作战任务;所述动作集为无人机的基础任务,包括掩护、就地等待、搜寻、前往轰炸点和或轰炸;所述状态集为系统环境状态和作战单元状态,其中,所述系统环境状态包括敌方基地完好、敌方基地重度摧毁和或敌方基地轻度摧毁,所述作战单元状态为无人机状态,所述无人机状态包括:无人机位置、无人机油量、无人机毁伤情况和或无人机弹药量;所述回报函数报酬表示无人机完成子任务后获得的即时报酬,所述即时报酬包括所述无人机完成任务后从系统环境中获得的回报以及所述无人机采取行动的成本;所述目标函数为所述无人机的行为准则,所述目标函数定义为: 为所述无人机执行动作后的奖励报酬,为所述无人机当前状态,是折扣因子,为所述无人机执行动作后的下一状态,是所述无人机下一状态中的最大化动作价值,为所述无人机动作的持续时间;S2,建立作战任务规划的仿真推演环境;S3,把作战任务分解成一系列并行的作战单元执行的子任务,其中,每个子任务表示一个选项,所述选项为动作序列,所述子任务包括轰炸敌方基地A任务、轰炸敌方基地B任务和或轰炸敌方基地C任务;S4,构建层次化决策框架,其中,所述层次化决策框架分为高层次决策框架和低层次决策框架,所述高层次决策框架用于选择要执行的动作序列、自动生成动作序列及根据所述低层次决策框架的反馈调整策略,所述低层次决策框架用于处理动作序列内的具体动作选择及反馈处理结果;S5,训练作战任务规划神经网络模型并构建作战任务规划系统。

全文数据:

权利要求:

百度查询: 厦门渊亭信息科技有限公司 面向仿真推演的任务规划方法、装置、介质及程序产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。