Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种变时域预测能量管理方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:燕山大学

摘要:本发明涉及一种变时域预测能量管理方法,包括下述步骤:获取当前车辆的状态量及其对应的时域,获得下一时刻的最佳预测时域,所述最佳预测时域长度能够不固定;根据所述最佳预测时域,预测车速;基于最佳预测时域,采用动态规划算法获得车辆的最优控制序列,从而实现变时域的能量管理;在车辆执行控制序列对应的控制指令后,进入新的状态;所述车辆的状态量包括动力电池荷电状态、车辆当前位置、当前车速、上一时刻预测车速。本发明的方法能够根据车辆状态和当前工况所在时域长度,预测下一工况的最佳预测时域,该最佳预测时域与当前状态所在时域长度不一定相同,从而提高预测能量管理的效果。

主权项:1.一种变时域预测能量管理方法,其特征在于,所述方法包括下述步骤:S100、获取当前车辆的状态量及其对应的时域,获得下一时刻的最佳预测时域,所述最佳预测时域长度能够不固定;S200、根据所述最佳预测时域,预测车速;S300、基于最佳预测时域所预测的车速,采用动态规划算法获得车辆的最优控制序列,从而实现变时域的能量管理;S400、在车辆执行控制序列对应的控制指令后,进入新的状态;所述车辆的状态量包括动力电池荷电状态、车辆当前位置、当前车速、上一时刻预测车速;所述最佳预测时域通过DQN网络模型获得,所述DQN网络模型实现下述动作价值函数:Qt=Rstat,actt+βmaxQstat,actt;θ式中:Q表示工况t下的动作价值函数值;R表示奖励函数;stat表示车辆在工况t下的状态量;actt表示车辆在工况t下的时域;θ为DQN网络模型的权值参数,β表示最大动作价值所占的权重;所述DQN网络模型通过下述步骤进行训练:S101、获取车辆的当前工况状态量及其对应时域,选择具有最大动作价值的时域;S102、根据选择的时域,进行车速预测,在模型预测框架下依据奖励函数计算奖励值和下一工况状态量;S103、在经验池中存储当前时刻信息组,所述信息组包括当前状态量、当前状态量对应时域、奖励值、下一时刻状态量;S104、在经验池中随机取出n个信息组,n为大于1的自然数;S105、对每一个信息组,计算实际动作价值,根据实际动作价值和最大动作价值的差的平方,采用梯度下降算法更新DQN网络模型参数;S106、将下一工况作为当前工况,返回S101。

全文数据:

权利要求:

百度查询: 燕山大学 一种变时域预测能量管理方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。