首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于强化学习算法的PID控制器参数自整定方法 

申请/专利权人:华南理工大学

申请日:2024-03-22

公开(公告)日:2024-06-25

公开(公告)号:CN118244618A

主分类号:G05B11/42

分类号:G05B11/42

优先权:

专利状态码:在审-公开

法律状态:2024.06.25#公开

摘要:本发明公开了一种基于强化学习算法的PID控制器参数自整定方法,包括以下步骤:通过算法损失函数设计,并对网络输入量进行预处理;构建近端策略优化强化学习算法与PID算法复合框架;算法首先从环境中采集电机的转速信息,之后基于环境信息,批评家网络进行参数更新;基于环境信息与批评家网络输出,对演员网路参数进行优化,演员网络对PID算法内的比例、积分、微分三个参数进行动态调节;重复上述步骤,直至满足强化学习算法终止条件。与传统控制器参数整定方法相比,本发明方法主要面向应用于变工况场景的控制器,本发明的比例参数可基于当前状态,通过神经网络动态调节,使系统具有较小的超调量、上升时间、调节时间等。

主权项:1.一种基于强化学习算法的PID控制器参数自整定方法,其特征在于,包括以下步骤:通过预实验采集对变工况场景下电机的转速数据进行采集;对所采集的电机转速数据进行数据预测处理,对负载变化区间进行预测;搭建强化学习PID网络模型,模型包括强化学习算法和PID算法,强化学习算法包括两个神经网络,分别为演员网络与批评家网络,同时设置一个经验缓冲区作为数据缓冲;PID算法独立于强化学习算法的更新频率运行,两种算法进行数据交互;强化学习算法训练过程中的转速信号进行归一化,基于信号中的环境信息,批评家网络进行参数更新;基于环境信息与批评家网络输出,对表演家网络参数进行优化,结合短时转速变化信息,对比例控制器的比例、积分、微分三个参数进行调整,以优化控制器综合控制性能。

全文数据:

权利要求:

百度查询: 华南理工大学 一种基于强化学习算法的PID控制器参数自整定方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。