首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于起重船吊物系统主动抑摆的强化学习实时参数优化方法及应用与设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华中科技大学

摘要:本发明属于摆振控制相关技术领域,其公开了一种用于起重船吊物系统主动抑摆的强化学习实时参数优化方法及应用与设备,该方法采用强化学习网络对起重船吊物系统的控制参数进行实时优化;强化学习网络的获取步骤为:S1,计算出起重船吊物系统在理想状态下的最优控制参数;S2,通过数值模拟确定控制参数的失稳边界,并结合最优控制参数构造参数稳定区间;S3,构建奖励函数,并构建吊物系统的Lyapunov函数,把Lyapunov函数加入强化学习的奖励函数中;采用部分扫频简谐荷载加部分自由摆动,同时全过程添加白噪声激励的方式构造训练激励;S4,基于参数稳定区间Ω、奖励函数、训练激励及采用的强化学习算法构建强化学习网络。本发明提高了控制效果。

主权项:1.一种用于起重船吊物系统主动抑摆的强化学习实时参数优化方法,其特征在于,该方法包括以下步骤:该方法采用强化学习网络对起重船吊物系统的控制参数进行实时优化;所述强化学习网络的获取步骤为:S1,计算出起重船吊物系统在理想状态下的最优控制参数PL,op=[kL,opτL,op],kL,op、τL,op分别为计得到的起重船吊物系统在理想状态下的最控制增益及最优控制时滞;S2,通过数值模拟确定控制参数的失稳边界,并结合最优控制参数PL,op构造一个以PL,op为核心的参数稳定区间Ω,将参数稳定区间Ω作为强化学习参数调整的范围;S3,以吊物系统摆动减小时奖励函数为正值、摆动增大时奖励函数为负值作为基本准则构建奖励函数,并构建吊物系统的Lyapunov函数,把Lyapunov函数加入强化学习的奖励函数中;同时,采用部分扫频简谐荷载加部分自由摆动,同时全过程添加白噪声激励的方式构造训练激励;S4,基于参数稳定区间Ω、奖励函数、训练激励及采用的强化学习算法构建强化学习网络。

全文数据:

权利要求:

百度查询: 华中科技大学 用于起重船吊物系统主动抑摆的强化学习实时参数优化方法及应用与设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。