恭喜南京航空航天大学高振兴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京航空航天大学申请的专利一种基于强化学习的飞行特情任务训练质量提升方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119357531B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411444235.X,技术领域涉及:G06F17/11;该发明授权一种基于强化学习的飞行特情任务训练质量提升方法及系统是由高振兴;张洋洋;孔维武设计研发完成,并于2024-10-16向国家知识产权局提交的专利申请。
本一种基于强化学习的飞行特情任务训练质量提升方法及系统在说明书摘要公布了:本发明公开了一种基于强化学习的飞行特情任务训练质量提升方法及系统,方法包括以下步骤:S1:基于目标飞机特情任务,构建飞行动力学模型、特情任务模型,建立强化学习环境。基于飞行安全操作要求建立奖励函数。S2:建立混合Actor‑Critic网络,并使用策略分离近端策略优化Actor‑SeparatedProximalPolicyOptimization,ASPPO算法训练特情处置决策网络,得到最优控制智能体。S3:基于最优控制智能体,生成多组动作序列集,并分析序列集中最大频繁动作序列,识别出操作动作偏时、动作多余、动作遗漏、动作错序的问题。
本发明授权一种基于强化学习的飞行特情任务训练质量提升方法及系统在权利要求书中公布了:1.一种基于强化学习的飞行特情任务训练质量提升方法,其特征在于,包括以下步骤:S1:基于目标飞机特情训练任务,构建强化学习环境;基于飞行安全操作要求,建立奖励函数;S2:建立混合Actor-Critic网络作为特情处置决策网络,基于强化学习环境和奖励函数,并使用策略分离近端策略优化算法ASPPO训练特情处置决策网络,得到最优控制智能体;S3:基于最优控制智能体,生成多组动作序列集,并分析动作序列集中最大频繁动作序列,识别出操作动作偏时、动作多余、动作遗漏、动作错序的问题;S3中,基于最优控制智能体,生成多组动作序列集,并分析动作序列集中最大频繁动作序列,识别出操作动作偏时、动作多余、动作遗漏、动作错序的问题的方法包括:基于每次实验最优决策智能体给出的动作构建动作序列Sj=a1,a2,a3,…,其中ai={a}为Sj中元素,{a}为动作事件,表示一个动作或多个同时操作的动作;预设动作序列的长度为元素个数;预设动作序列的大小为所有元素包含的动作事件总个数;动作序列Sj中ai的确定需预设最小时间间隔Tm,若两个或多个动作操作时间间隔小于Tm,则认为两个或多个动作同时进行,其中,j=1,2,3,…,N为实验序号;预设最小支持度pmin,对于Sj进行频繁序列模式进行挖掘,产生候选频繁动作序列模式在产生候选频繁动作序列模式后,若大小为κ+1的候选序列中长度为κ的子序列至少有一个是非频繁的,则被舍弃;若无法再找到大小为κ+1的候选序列,则最大长度序列模式即为Lκ;基于最大长度的频繁动作序列模式,通过统计多次实验数据中动作序列中的间隔时间,求取均值与方差,得到特情任务训练过程中,最优动作序列及时间间隔;基于飞行员在特情任务训练中操作的动作序列以及动作时间间隔,与最优决策结果分析得到的最优动作序列及时间间隔对比,识别并完善飞行员的操作;预设最小支持度pmin,对于Sj进行频繁序列模式进行挖掘的方法包括:由N次实验得到动作序列集Γ=S1,S2,…,Sj,…,SN,计算大小为κ的频繁动作序列模式Lκ,计算Γ中所有大小为κ的动作序列的支持度:其中,pA1,A2,…,Ak表示在动作序列集Γ中序列A1,A2,…,Ak出现的次数,由序列大小与序列长度定义得到,k≤κ,count·表示计数;对序列A1,A2,…,Ak中任意两个动作若n<m,必有i<l,An、Am表示一个或多个同时的动作,无论A1,A2,…,Ak在某个序列Sj中出现几次,都只计数1次;判断pA1,A2,…,Ak≥pmin是否成立,不成立则结束算法,表示无频繁动作序列模式Lκ;成立则进行Γ中大小为κ+1的频繁动作序列模式Lκ+1的计算。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。