Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜国网北京市电力公司;国家电网有限公司齐小伟获国家专利权

恭喜国网北京市电力公司;国家电网有限公司齐小伟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜国网北京市电力公司;国家电网有限公司申请的专利一种配电网动案辅助决策方法、系统、装置和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114298429B

龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111661200.8,技术领域涉及:G06Q10/063;该发明授权一种配电网动案辅助决策方法、系统、装置和存储介质是由齐小伟;陈秀海;李昕;李永勋;姚巍;韩爽;关鹏;陈佳博;彭博;张育臣设计研发完成,并于2021-12-30向国家知识产权局提交的专利申请。

一种配电网动案辅助决策方法、系统、装置和存储介质在说明书摘要公布了:本发明公开了一种配电网动案辅助决策方法、系统、装置和存储介质,方法包括步骤:获取配电网在线运行数据;将所述配电网在线运行数据输入预设的配电网动案辅助决策模型中;所述配电网动案辅助决策模型输出令配电网安全未定运行的网络结构;所述配电网动案辅助决策模型基于DQN强化学习算法训练形成。对于在线配电网只需输入其对应的状态,就可以重构配电网的拓扑结构,又因为判断过程无需对整个配电网所有重构方案全部计算,计算量小,所耗用的时间较短,因而基于强化学习方法的配电网动案辅助决策方法具有运算速度快、效率高等优点。

本发明授权一种配电网动案辅助决策方法、系统、装置和存储介质在权利要求书中公布了:1.一种基于深度神经网络的配电网动案辅助决策方法,其特征在于,包括如下步骤:获取配电网在线运行数据;将所述配电网在线运行数据输入预设的配电网动案辅助决策模型中;所述配电网动案辅助决策模型输出令配电网安全未定运行的网络结构;其中,所述配电网动案辅助决策模型基于DQN强化学习算法训练形成,具体包括:步骤1:选取配电网历史运行数据作为数据源,将配电网辅助决策所涉及的配电网历史运行数据转化为适合强化学习算法的原始样本集;配电网历史运行数据包括:能够模拟配电系统的数据和各输入数据;各输入数据包括风机数量、光伏发电数量、负载数量和开关操作频率;同时记录每个开关最后一次操作与当前时刻之间的时间间隔: 当时间间隔小于预设值时,在预设值范围内使该开关不动作;在前置时间到达TSW之后,该值不会进一步增加,足够表明开关没有过度使用;因此,SWtr不是预先准备好的,而是从代理的动作中提取出来;SWtr表示开关的切换记录;表示第m个开关的时间间隔;Nsw表示开关数量;步骤2:设置ε-greedy策略选取动作;步骤3DQN算法训练过程,包括:步骤31:构建配电网系统环境模型;步骤32:构建智能体动作空间;步骤33:智能体奖励机制;智能体在时间周期内通过持续学习最大化其累计回报,代理的目的是保持网络的辐射性;对于给定的发电量和负载量,将线路流量或总线电压保持在一定范围内;DQN模型的奖励机制为:给定状态s和动作a,每个时间步长中的总奖励rts,a表示如下: 其中,L为网络中线路数量;Ii为第i行线路的载流量;α为线路超载惩罚权重;B为网络中总母线数;Vj为第j条线路电压标幺值;β为母线电压惩罚权重;γ为开关使用过度惩罚权重;pline,i表示第i条线路的载流量惩罚值;pbus,j表示第j条母线的电压惩罚值;psw,k表示第k个开关的过度使用惩罚值;swtr,k表示第k个开关的时间间隔;如果重新配置的网络是辐射形的,那么每个时间步都给代理一个奖赏rinit;否则,给代理消极奖励rfail,同时模拟情节将立即终止;如果重新配置的网络是放射性的,当网络违反线路容量或母线电压约束时,智能体会根据违反的程度和每一次违反对应的权重因子对pline和pbus进行惩罚;步骤34:DQN算法流程;1初始化回放记忆单元D,可容纳的数据条数为N;2初始化真实Q网络,随机生成权重ω;3以同样的结构和参数生成目标Q网络,权重ω′=ω;4循环遍历,每次事件episode=1,2,…,M;其中M为总天数;episode表示事件;5初始化预处理后的第一个状态x1表示状态S1中的完整数据集合;表示在第一个时间步风力发电机的发电量数据集;表示在第一个时间步光伏的发电量数据集;D1表示第一个时间步配电网中的负载需求数据集;表示第一个时间步每个开关自上次操作以来所经过的时间间隔的集合;6循环遍历每个事件的每一步step=1,2,…,T;以15min为间隔,将一天分成96个点,T=96;7用∈-greedy策略生成动作at:以∈概率选择一个随机的动作at;如果小概率事件没发生,则用贪婪策略选择当前值函数最大的那个动作; 其中,a表示智能体在某一时刻采取的动作;ω表示表示深度神经网络中的权重参数;st表示在时刻t配电网的状态;8在配电网仿真环境中执行开关动作;9如果重新配置的网络是放射性的;10求解潮流,保存所有线路载流量所有母线电压并更新记录,根据步骤33的第一个公式计算奖励rts,a;11否则rts,a=rfail;12接收奖励rts,a及新的状态st+1;st+1表示在时刻t+1时配电网的状态;13将转换结果st,at,rts,a,st+1存入D中;D表示回放记忆单元;14从D中均匀随机采样一个转换样本数据sj,aj,rj,sj+1;sj表示在某个时间步j时配电网的状态;aj表示在状态sj下智能体采取的动作;rj表示在状态sj下采取动作aj后智能体获得的奖励;sj+1表示在状态sj下采取动作aj后环境转移到的新状态;15判断是否是一个事件的终止状态,若是终止状态则奖励为rj;否则利用TD目标网络参数ω计算TD回报为:rj+γmaxa′Qs′,a′,ω′;TD表示时间差分;s′、a′、ω′分别表示下一个状态、下一个最优动作、目标Q网络的权重;16执行梯度下降算法更新网络参数; 17更新动作值函数逼近的网络参数θ=θ+Δθ;θ表示深度神经网络的参数;r表示智能体在执行动作后从环境中获得的奖励;s表示智能体在当前时刻所处的环境状态;a表示智能体在当前状态下选择的动作;ω表示Q网络的权重参数;18每隔C步更新目标Q网络;19结束每次事件的循环;20结束事件间的循环;经过训练学习之后,形成基于强化学习算法的配电网动案辅助决策模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网北京市电力公司;国家电网有限公司,其通讯地址为:100031 北京市西城区前门西大街41号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。