首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于强化学习的灾后电-路协同修复方法、系统与设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安交通大学;国网江西省电力有限公司

摘要:本发明公开了基于强化学习的灾后电‑路协同修复方法、系统与设备,通过配电网与城市交通网络的网络拓扑、故障信息以及维修站位置和维修队位置,构建时序马尔可夫决策网络,根据电‑路联合系统当前所处状态以及可采取的动作集合,以蒙特卡洛树搜索方法根据时序马尔可夫决策网络对维修队的修复对象进行选择,形成以电‑路联合系统的状态为样本、以当前状态下的最佳修复对象为样本标签的数据集,构建以电‑路联合系统的状态为输入、以电‑路联合系统的下一步的修复对象为输出的快速决策网络,本发明考虑了电‑路联合系统修复计划存在的矛盾性与协同性,构建的强化学习算法有助于提高两者的协同修复效率,增强电‑路联合系统对自然灾害的抵御能力。

主权项:1.一种基于强化学习的灾后电-路协同修复方法,其特征在于,包括以下步骤S1,基于配电网与城市交通网络的网络拓扑、故障信息以及维修站位置和维修队位置,构建时序马尔可夫决策网络;时序马尔可夫决策网络包括状态空间、动作空间、状态转移和奖励函数四元组;从配电网、城市交通网络和维修队三个层次收集数据信息进行拼接,得到状态空间S的表示如下: 其中,e1,e2,…,en分别表示各输电线路的运行状态,n为配电网输电线路总数;r1,r2,…,rm分别表示各交通道路的通行状态,m为交通网络道路总数;共计n个0-1变量中仅有一个变量表示电力部门维修队的当前位置在输电线路i处;共计m个0-1变量中仅有一个变量表示交通部门维修队的当前位置在交通道路j处;采用集合Et和集合Rt分别表示修复后恢复正常的线路编号集合和道路编号集合,动作空间At的表示如下: 变量和分别表示线路i和道路j的编号;当故障线路、故障道路经修复后恢复正常运行状态,或维修队位置发生变化时,对状态空间S中的0-1变量进行更新;以社会效益损失值的负数作为每一步修复计划的奖励值,奖励函数rs,a的表达式如下: 其中,是配电网节点总数,是在状态s下节点i的失负荷功率,是在状态s下前往故障线路a时所需的通行时间,是修复线路为a时所需的修复时间;是在状态s下前往故障道路a时所需的通行时间,是修复道路为a时所需的修复时间,La是道路a的长度,Ce为单位电量产生的社会效益,Cr为单位长度道路在单位时间内产生的社会效益;S2,根据电-路联合系统当前所处状态以及可采取的动作集合,采用蒙特卡洛树搜索方法根据时序马尔可夫决策网络对维修队下一步的修复对象进行选择,形成以电-路联合系统的状态为样本、以当前状态下的最佳修复对象为样本标签的数据集;S3,构建以电-路联合系统的状态为输入、以电-路联合系统的下一步的修复对象为输出的快速决策网络,采用S2获取的数据集对快速决策网络进行优化,最小化快速决策网络的动作选择误差;S4,采用优化后的快速决策网络,根据自然灾害下配电网与交通网络的故障数据生成协同修复计划。

全文数据:

权利要求:

百度查询: 西安交通大学 国网江西省电力有限公司 基于强化学习的灾后电-路协同修复方法、系统与设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

-相关技术