【发明公布】六自由度环境下基于双延时确定策略梯度的空战决策方法_北京航空航天大学_202410458544.6

申请/专利权人：北京航空航天大学

申请日：2024-04-17

公开（公告）日：2024-06-14

公开（公告）号：CN118192212A

主分类号：G05B11/42

分类号：G05B11/42

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明涉及一种六自由度环境下基于双延时确定策略梯度的空战决策方法，属于无人机控制领域。本发明针对现有技术存在的模型简单、与空战实际相去较远的问题，建立了UCAV非线性六自由度全量方程并在此基础上构建了双延时确定策略梯度算法的空战决策框架。本发明建立了UCAV的非线性六自由度模型，相较于以过载为输入的三自由度质点模型更加贴近空战实际，得到的结果更具有参考价值。本发明采用了具有连续决策输出的双延时确定策略梯度算法，相较于以DQN算法为代表的离散决策输出算法，无需将控制指令离散化为几个机动动作，拓宽了决策指令的可选择范围，更具有实际应用价值。

主权项：1.一种六自由度环境下基于双延时确定策略梯度的空战决策方法，其特征在于，该方法包括如下步骤：步骤S1、建立UCAV（UnmannedCombatAirVehicle）非线性六自由度模型，在MATLABSIMULINK中构建六自由度模型并利用PID方法设计控制器；步骤S2、构建仿真空战环境，其中，敌我两架UCAV性能相同，采用了基于攻击区假定的胜负判定方法，敌机决策采用纯追踪法；步骤S3、实现基于双延时确定策略梯度算法的空战决策训练框架，将空战决策问题建模为马尔可夫决策过程，设计状态空间、动作空间及奖励函数；步骤S4、随机初始化空战态势并通过不断训练得到空战决策训练框架中用于决策的策略网络；步骤S5、利用得到的策略网络在仿真环境中进行空战，我机使用策略网络输出的指令，敌机使用纯追踪法产生的指令。

全文数据：

权利要求：

百度查询：北京航空航天大学六自由度环境下基于双延时确定策略梯度的空战决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种感染科医用防护用具回收设备_丰都县十直镇卫生院(丰都县十直镇计划生育服务站)_202210727764.5

下一篇：城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

相关技术

一种感染科医用防护用具回收设备_丰都县十直镇卫生院(丰都县十直镇计划生育服务站)_202210727764.5

城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

一种汽车风窗玻璃试验中AB区的投射设备_中汽研汽车检验中心(武汉)有限公司_202410456408.3

外肢体机器人作业策略半物理仿真方法及系统_山东大学_202111470212.2

一种发动机仿真模型的精度评估方法、装置以及电子设备_西安航天动力研究所_202410282665.X

一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

一种齿轮加工成型设备_兴化金马鹿机电科技有限公司_202410356685.7

一种固态电解质包覆的钴酸锂正极材料及其制备方法_英德市科恒新能源科技有限公司_202410408908.X

一种双层保温日光温室_山东同岚农业发展集团有限公司_202410511060.3

一种飞机弹射座椅摇臂的快速成形方法_国营芜湖机械厂_202310163802.3

一种磁性吸附材料及其制备方法和应用_国家粮食和物资储备局科学研究院_202310376075.9

一种防治猪繁殖与呼吸道综合征的复方中药可溶性粉的制备方法和应用_广东海大集团股份有限公司_202211577992.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】六自由度环境下基于双延时确定策略梯度的空战决策方法_北京航空航天大学_202410458544.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务