买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西南交通大学
摘要:本发明公开了基于PRL的功率融通型牵引供电系统能量管理方法,所述能量管理方法根据已建立的电气化铁路能量管理过程的马尔科夫决策模型,基于强化学习算法分别构建原始功率数据更新链以及镜像功率数据更新链,进行离散同时并行训练以及在线前后台并行运行;所述能量管理方法用于电气化铁路储能系统中,通过两组更新链实时并行在线更新,实现牵引功率数据的复用,能有效提升动作‑状态价值函数矩阵的收敛速度,同时可以通过控制功率融通装置,对牵引供电系统与储能系统进行自适应能量交换,具备良好的迁移能力。
主权项:1.基于PRL的功率融通型牵引供电系统能量管理方法,其特征在于,所述能量管理方法基于电气化铁路能量管理过程的马尔科夫决策模型,进行离散同时并行训练以及在线前后台并行运行,所述能量管理方法用于电气化铁路储能系统中,通过控制功率融通装置与DCDC变换器完成能量交换;其中,所述离散同时并行训练具体包括以下步骤:S111:马尔科夫决策模型中载入若干个时间段内的功率数据;S112:获取原始功率训练数据集;S113:获取镜像训练数据集;S114:基于原始功率数据训练数据集,计算当前牵引供电系统原始状态变量,获取原始功率数据更新链的状态变量;基于镜像训练数据集,计算镜像状态变量,获取镜像功率数据更新链的状态变量;S115:建立并行强化学习系统的知识矩阵迭代更新框架,所述并行强化学习系统基于原始功率数据更新链以及镜像功率数据更新链,对动作-状态价值函数矩阵进行同步迭代更新;具体包括:基于原始功率数据更新链的状态变量以及镜像功率数据更新链的状态变量,能量管理系统分别进行并行决策,获取原始功率数据更新链输出动作以及镜像功率数据更新链的输出动作,并基于贪婪算法对两组输出动作进行调整,更新储能系统状态,计算对应的奖励数值,能量管理系统基于两组更新链的输出动作的奖励数值,分别更新动作-状态价值矩阵的对应参数;S116:更新完成后,若未结束训练进入下一循环,若已结束训练则退出循环;所述在线前后台并行运行具体包括以下步骤:S121:载入离散同时并行训练获取的动作-状态价值函数矩阵;S122:将二次设备数据载入进所述马尔科夫决策模型中;S123:更新原始状态变量以及镜像状态变量,采用前台计算机设备对原始功率数据更新链进行优先更新,即控制储能系统与牵引供电系统、外部电力系统进行功率交换,并对动作-状态价值矩阵、状态变量进行更新;S124:在前台计算机设备进行原始数据更新链更新运行时,采用后台计算机设备对镜像功率数据更新链进行同步更新,仅用于更新镜像数据更新链中动作-状态价值矩阵与状态变量,不控制牵引供电系统进行功率交换;S125:若收到停止指令则结束,若没有收到停止指令,重复S122~S124。
全文数据:
权利要求:
百度查询: 西南交通大学 基于PRL的功率融通型牵引供电系统能量管理方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。