首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

无人机飞行航线更新规划的方法、装置、设备及存储介质 

申请/专利权人:华南师范大学

申请日:2022-06-27

公开(公告)日:2024-06-28

公开(公告)号:CN115167506B

主分类号:G05D1/695

分类号:G05D1/695;G05D109/20

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2022.10.28#实质审查的生效;2022.10.11#公开

摘要:本发明涉及无人机无线通信技术领域,特别涉及一种无人机飞行航线更新规划的方法、装置、设备以及存储介质,无人机在执行飞行任务时,能够对无人机的当前状态进行实时检测,并通过多步深度学习网络模型,对无人机的飞行航线进行更新,控制无人机沿着更新后的飞行航线移动,避免无人机靠近干扰源或者进入弱信号覆盖区域,从而保障了无人机进行数据传输的质量,并能够对该多步深度学习网络模型进行持续更新,提高无人机飞行航线更新规划的精准性,从而提高了无人机执行任务的效率。

主权项:1.一种无人机飞行航线更新规划的方法,其特征在于,包括以下步骤:S1:获取无人机在目标区域内的飞行航线,控制无人机沿着所述飞行航线进行飞行,其中,所述飞行航线包括终止点;S2:获取无人机的飞行过程中的实时信噪比数据;根据所述实时信噪比数据,对所述无人机进行干扰检测,获取干扰检测结果;根据所述干扰检测结果,获取所述无人机当前时刻的位置数据作为当前干扰状态的位置数据;将所述目标区域划分为若干个通信区域,根据所述无人机干扰状态的位置数据,确定所述无人机干扰状态关联的通信区域,并获取所述无人机干扰状态关联的通信区域的位置数据;根据所述无人机干扰状态的位置数据、关联的通信区域的位置数据、实时信噪比数据以及预设的信号中断概率算法,获取所述无人机干扰状态的信号中断概率数据,其中,所述信号中断概率算法为:Poutt=Pst,bt,SIRt式中,Poutt为所述无人机第t个干扰状态的信号中断概率数据,st为所述无人机第t个干扰状态的位置数据,bt为所述无人机第t个干扰状态关联的通信区域的位置数据,SIRt为所述无人机第t个干扰状态的实时信噪比数据;P为关于所述无人机的干扰状态的信号中断概率数据计算函数;S3:将所述无人机干扰状态的位置数据输入至预设的多步深度学习网络模型的动作模块中,获取所述无人机干扰状态的移动方向数据;根据所述移动方向数据,对所述飞行航线进行更新,控制无人机沿着更新后的飞行航线移动;其中,所述多步深度学习网络模型的评估模块包括相同的、依次连接的第一子评估模块以及第二子评估模块,所述动作模块包括相同的、依次连接的第一子动作模块以及第二子动作模块;S4:将所述无人机干扰状态的位置数据以及信号中断概率数据输入至所述多步深度学习网络模型的评估模块的第一子评估模块中,根据预设的移动收益数据计算算法,获取所述第一子评估模块输出的所述无人机干扰状态的移动收益数据,并与无人机干扰状态的位置数据进行组合,作为所述无人机的移动收益关联组;其中,所述移动收益数据计算算法为:rt=-1-δ*Poutt+1式中,rt为所述无人机第t个干扰状态的移动收益数据,δ为惩罚权重参数,Poutt+1为所述无人机第t+1个干扰状态的信号中断概率数据;S5:获取无人机在飞行过程中经过预设数量的干扰状态位置对应的若干个所述无人机的移动收益关联组,根据所述无人机的移动收益关联组中的无人机干扰状态的位置数据,对所述无人机干扰状态下的位置进行判断,获取位置判断结果,其中,所述位置判断结果包括终点位置结果,位置偏移结果以及位置符合结果;根据所述无人机干扰状态的位置判断结果、无人机干扰状态的移动收益数据以及预设的期望值计算算法,获取各个无人机的移动收益关联组对应的期望值,其中,所述期望值计算算法为: 式中,yt为所述无人机第t个干扰状态的期望值,rt为所述无人机第t个干扰状态的移动收益数据,st+1为所述无人机第t+1个干扰状态的位置数据,ct为所述无人机第t个干扰状态的位置判断结果,A为终点位置结果,B为位置偏移结果,C为位置符合结果,γ为预设的期待系数,Q'为所述第二子评估模块中的评估计算函数,μ'为所述第二子动作模块中的动作计算函数,θμ'为所述第二子动作模块的动作权重参数;θQ'为所述第二子评估模块的评估权重参数;Rdes为预设的奖励值,Pob为预设的惩罚值;根据所述各个无人机的移动收益关联组对应的移动方向数据、位置数据,根据所述各个无人机的移动收益关联组对应的期望值、移动方向数据以及预设的误差计算算法,获取所述第一子评估模块的误差值,根据所述误差值,对所述第一子评估模块的评估权重参数进行更新,获取更新后的第一子评估模块的评估权重参数,其中,所述误差计算算法为: 式中,L为所述误差值,N为所述无人机的移动收益关联组的总数,Q为所述第一子评估模块中的评估计算函数,st为所述无人机第t个干扰状态的位置数据,at为所述无人机第t个干扰状态的移动方向数据,θQ为所述第一子评估模块的评估权重参数;根据所述各个无人机的移动收益关联组对应的期望值以及预设的梯度更新计算算法,获取所述第一子动作模块的梯度更新值,根据所述梯度更新值,对所述第一子动作模块的动作权重参数进行更新,获取更新后的第一子动作模块的动作权重参数,其中,所述梯度更新计算算法为: 式中,为第t个干扰状态的梯度更新值,μ为所述第一子动作模块中的动作计算函数,为Q在第t个干扰状态下,对移动方向数据为μst求解的梯度更新值,为μ在第t个干扰状态下,对所述第一子动作模块的动作权重参数θμ求解的梯度更新值,α为预设的梯度下降步长,θμ所述第一子动作模块的动作权重参数;根据所述更新后的第一子评估模块的评估权重参数、更新后的第一子动作模块的动作权重参数以及预设的权重参数更新算法,分别对所述第二子评估模块的权重参数以及第二子动作模块的权重参数进行更新,获取更新后的第二子评估模块的评估权重参数、更新后的第二子动作模块的动作权重参数,对所述多步深度学习网络模型的动作模块以及评估模块进行更新,获取更新后的多步深度学习网络模型;其中,所述权重参数更新算法为:θQ'←τθQ+1-τθQ',θμ'←τθμ+1-τθμ'式中,θQ'为所述第二子评估模块的评估权重参数;θμ'为所述第二子动作模块的动作权重参数,θμ所述第一子动作模块的动作权重参数,τ为预设的优化参数;S6:在无人机检测到下一干扰状态的位置数据时,将所述无人机下一干扰状态的位置数据输入至更新后的多步深度学习网络模型,获得所述无人机下一干扰状态的位置数据对应的移动方向数据;根据所述无人机下一干扰状态的位置数据对应的移动方向数据,对所述飞行航线进行更新,控制无人机沿着更新后的飞行航线移动;S7:重复步骤S4~S6,对所述飞行航线进行更新,控制无人机沿着更新后的飞行航线移动,直到无人机移动至所述终止点。

全文数据:

权利要求:

百度查询: 华南师范大学 无人机飞行航线更新规划的方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。