首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种IES多模态分层多目标生成式对抗一致性优化加速方法 

申请/专利权人:广西大学

申请日:2023-11-19

公开(公告)日:2024-02-20

公开(公告)号:CN117575392A

主分类号:G06Q10/0639

分类号:G06Q10/0639;G06Q50/06;G06N3/0475;G06N3/094

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.03.08#实质审查的生效;2024.02.20#公开

摘要:本发明提出一种IES多模态分层多目标生成式对抗一致性优化加速方法,该方法将多模态问题优化方法、量子和模糊逻辑的生成式对抗网络加速方法和多层多目标分布式复制者动态一致性方法进行结合;应用多层多目标分布式复制者动态一致性方法,在多个优化目标相互博弈的情况下寻找出使博弈演化稳定均衡的最优解;引入小生境策略和二元锦标赛选择机制赋予帕累托解集多模态的特性;在方法的迭代过程中加入量子和模糊逻辑的生成式对抗网络提高方法速度。IES多模态分层多目标生成式对抗一致性优化加速方法能解决综合能源系统的多目标优化问题,实现高速获得综合能源系统的解决目标博弈问题的多目标多模态的帕累托解集的功能。

主权项:1.一种IES多模态分层多目标生成式对抗一致性优化加速方法,其特征在于,将多模态问题优化方法、量子和模糊逻辑的生成式对抗网络加速方法和多层多目标分布式复制者动态一致性方法进行结合,用于解决综合能源系统的优化目标相互博弈的多目标优化问题,针对多目标的解集相互博弈的问题寻找到能够达到演化博弈稳定均衡的最优帕累托解集,能够克服非多层分布式方法用于大规模系统时计算速度慢和收敛性差的缺点,相比于集中式优化方法具有更高的信息私密性,运用加速过程提高整个方法的收敛时间,针对多目标多模态问题提供更加多样化的解集;在使用过程中的步骤为:步骤1:令当前所处的时间段t=0,开始第t时段的优化求解;步骤2:方法初始化,确定系统的总分层数Nlayer,输入由被优化系统的拓扑结构图计算得到的拉普拉斯矩阵LG,拓扑结构图采用无向无权图,确定每一分层的最大迭代步数K,确定多层多目标分布式复制者动态一致性方法中个体策略选择迭代过程的最大迭代步数Ks,令迭代层数Nl=0,令当前迭代过程迭代步数k=0;拉普拉斯矩阵LG中的元素lii与元素lij为: 其中,aij为邻接矩阵AG中的元素,aij取值为: 其中,vi和vj分别拓扑结构中两个不同的点,vi,vj∈VG,VG={v1,v2,...,vM}为节点的集合,M为拓扑图节点数;vivj为拓扑结构中两个不同的点构成的边;为边的集合;综合能源系统多模态多目标优化问题的目标函数fx为: 其中,fe表示总能耗目标的目标函数,fc表示总碳排放目标的目标函数,fξ表示整个系统总能效目标的目标函数,表示用户满意度的目标函数,fF表示系统调节能力灵活度的目标函数;x表示多维的决策向量,包括第t时段第j台供能机组在第t时段的有功出力第t时段内供能机组的能源供给量Ej,t,第j个供能机组的能源消耗量Wj,用户经过需求响应后第t时段的电、气和热负荷变化量ΔWte、ΔWtg和ΔWth,供能机组所能提供的电能、热能、气能上调和下调灵活性指标和min为选取最小值的函数;总能耗目标的目标函数fe为: 其中,n为供能机组个数,为第j台供能机组在第t时段内的发电能耗,ttotal为调度周期内被均分的总段数,aj、bj和cj分别为第j台供能机组的二次项、一次项和常数项能耗系数;总碳排放目标的目标函数fc为: 其中,为第j台供能机组在第t时段内的碳排放量,αj、βj和γj分别为第j台供能机组的二次项、一次项和常数项碳排放系数;整个系统总能效目标的目标函数fξ为: 其中,ξ为系统完整调度周期内的综合能效,为第t时段考虑综合需求响应后第j个供能机组对应承担地负荷量,dj为第j类能源的折标准煤参考系数,ηs,j为第j个供能机组的能效,第j个供能机组的能效为: 其中Ej为第j个供能机组的能源供给量;用户满意度的目标函数为: 其中用户满意度用表示,Wte、Wtg和Wth为原始电、气和热负荷;负荷响应量越大,即用户负荷调整行为越多,用户满意度调整值越大,用户用能方式满意度水平越低;max为选取最大值的函数;系统调节能力灵活度的目标函数fF为:minfF=min-Fload=-ω1·FE+ω2·FH+ω3·FG9其中Fload为综合能源系统灵活性评价指标;FE、FH和FG分别代表电、热和气环节的综合灵活性指标;ω1、ω2和ω3分别代表电、热和气环节的权重系数;电环节的综合灵活性指标FE为: 其中和分别表示供能机组所能提供的电能上调和下调灵活性指标;热环节的综合灵活性指标FH为: 其中和分别表示供能机组所能提供的热能上调和下调灵活性指标;气环节的综合灵活性指标FG为: 其中和分别表示供能机组所能提供的气能上调和下调灵活性指标;机组的功率约束包括功率平衡约束和上下限出力约束;功率平衡约束为: 其中为第t时段系统总负荷需求;供能机组上下限出力约束为: 其中为第j台供能机组在第t时段的有功出力下限,为第j台供能机组在第t时段的有功出力上限;步骤3:将完整的综合能源系统分区,每个区域作为一个智能体,作为当前层迭代的初始智能体,选取一个领导者智能体,其余的为跟随者智能体,领导者智能体的选取选择拓扑结构的中心;步骤4:在决策空间随机生成每个智能体初始的一致性变量值与迭代变量值;在多层多目标分布式复制者动态一致性方法中,每个个体的迭代变量值为个体所选择的博弈策略,博弈策略集合为S={s1,s2,…,sn},si∈S是个体i的一个策略,s1为个体1的一个策略,s2为个体2的一个策略;每个智能体当作博弈中的个体,选择各个策略的个体数的集合为xs={xs1,xs2,…,xsn},其中,xs1为选择策略s1的个体数,xs2为选择策略s2的个体数,xsn为选择策略sn的个体数,xsi表示选择策略si的个体数,初始的xs随机生成;对多个目标函数做加权处理:第p个智能体加权总目标函数值fT,p为: 其中,ρi为目标函数对应的加权参数值,对应的ρ1、ρ2、ρ3、ρ4和ρ5分别为目标函数fe、fc、fξ、和fF对应的加权参数值;策略si相应的适应度函数fisi,xsi为:fisi,xsi=fTsi×xsi16其中,fTsi为选择策略si的一个个体相应的加权总目标函数值;智能体的一致性变量值为在该时间段下该策略变化迭代代数下的平均适应度值;第t时段第k策略变化迭代代数中的第ks代策略选择的迭代过程的一致性变量为: 其中fave,t,kks为第t时段第k策略变化迭代代数中的第ks代策略选择的迭代过程的平均适应度值,piks为第ks代策略选择的迭代过程中的选择策略si的个体比例;xsiks为第ks代策略选择的迭代过程中的选择策略si的个体数;ks为个体策略选择的迭代过程的迭代代数;步骤5:令ks=0,进入个体策略选择的迭代过程;运用复制者动态模型演化规律更新策略的个体数及比例;复制者动态模型演化规律为: 其中,xsiks+1和xsiks分别为第ks+1和第ks代策略选择的迭代过程的选择策略si的个体数,piks+1为第ks+1代策略选择的迭代过程的选择策略si的个体占种群的比例;此后,令ks=ks+1;步骤6:判断策略变化迭代代数是否达到个体策略选择迭代过程的最大迭代步数Ks;执行完第Ks代的个体策略选择迭代过程之后,求出个体策略选择迭代过程完成后的一致性变量此后,进入策略变化的迭代阶段;步骤7:进入策略变化的迭代阶段后,结合智能体的拓扑结构图分别对跟随者智能体和领导者智能体的决策变量进行更新,之后比较决策变量和对应的目标空间函数值,生成帕累托最优解集和帕累托前沿;由输入的拉普拉斯矩阵LG求出智能体的行随机矩阵中的第k次迭代元素dijk: 经过迭代更新后第t时段第i个领导者智能体在第k+1次策略变化迭代的决策变量为: 经过迭代更新后第t时段第i个跟随者智能体在第k+1次策略变化迭代的决策变量为: 其中,和分别为第t时段第i个领导者智能体和跟随者智能体在第k次策略变化迭代的决策变量;ε为多层多目标分布式复制者动态一致性方法的功率平衡调节因子;ΔPtk是第t时段第k次迭代的功率偏差;k为策略变化的迭代过程的迭代代数;步骤8:判断当前策略变化的迭代阶段迭代的代数是否满足k<n10或K-n10<k<K,n10为加速阶段之前的和加速阶段之后的策略变化的迭代次数;若满足k<n10或K-n10<k<K,则继续运用多层多目标分布式复者动态一致性方法进行迭代;若不满足k<n10或K-n10<k<K,则进入量子和模糊逻辑的生成式对抗网络,执行加速过程;步骤9:若满足k<n10或K-n10<k<K,则执行迭代过程,开始下一次策略变化的迭代过程,运用小生境策略和二元锦标赛选择机制选择参与下次迭代的智能体,以解决多模态的问题;设定小生境大小和进入下一次迭代的智能体个数均为Nagent,下一次迭代的智能体放入迭代集中;步骤10:随机从种群中选择智能体进入候选解集,直至小生境被填满为止;步骤11:计算候选解集中第一个智能体作为二元锦标赛中的一个个体a和该集合中除该智能体之外的每一个智能体之间的欧式距离D,并选择与智能体有最小的欧式距离的智能体作为二元锦标赛中的另一个个体b,判断二元锦标赛中两个个体a与个体b之间的支配关系,在两个个体中选出一个进入迭代集;第t时段两个个体之间的欧式距离Dt为: 其中和分别表示在第t时段个体a与个体b的决策变量的第i个元素,m表示决策变量的维度;和分别表示第t时段个体a与个体b的决策变量的第1个元素;和分别表示第t时段个体a与个体b的决策变量的第m个元素;二元锦标赛选择机制为:先判断二元锦标赛中两个个体a与个体b之间的支配关系,如果两个个体中个体a支配个体b,那么就把个体a放入迭代集中,反之将个体b放入迭代集中;但是,若两个个体互不支配则计算每个个体在决策空间中的拥挤距离并选择拥挤距离大的个体放入迭代集中;若两个个体的拥挤距离是相等的,把个体a放入迭代集中;由二元锦标赛选择机制选择得到的解就是多模态解,保证多种情况下解的全面性,而未被保留在迭代集中的解则是决策者不会使用的解;拥挤距离CDi,X为: 其中,表示第t时段第i个智能体在决策空间中的拥挤距离;1≤i≤Nagent;表示第t时段的第i个智能体在决策空间第j维上的值,1≤j≤m,表示第t时段的第i+1个智能体在决策空间第j维上的值,表示第t时段的第i-1个智能体在决策空间第j维上的值,表示第t时段的第i+1个智能体在决策空间第1维上的值,表示第t时段的第i-1个智能体在决策空间第1维上的值,表示第t时段的第i+1个智能体在决策空间第m维上的值,表示第t时段的第i-1个智能体在决策空间第m维上的值;表示第t时段的在决策空间第j维上的最大值,表示第t时段的在决策空间第j维上的最小值,表示第t时段的在决策空间第1维上的最大值,表示第t时段的在决策空间第1维上的最小值,表示第t时段的在决策空间第m维上的最大值,表示第t时段的在决策空间第m维上的最小值;步骤12:重复步骤9,直至填满迭代集;步骤13:进入个体策略选择的迭代过程,更新一致性变量;之后进入策略变化的迭代过程;结合智能体的拓扑结构图对迭代集中的跟随者智能体和领导者智能体的决策变量进行更新,之后比较决策变量和目标空间对应值,生成帕累托最优解集和帕累托前沿;步骤14:若不满足k<n10或K-n10<k<K,则进入量子和模糊逻辑的生成式对抗网络加速的加速过程,输入Nagent个m维的决策变量和相应的目标函数值;步骤15:据Nagent个智能体的加权总目标函数值,通过模糊逻辑策略将智能体划分为四个模糊逻辑子集;每个智能体都被基于加权总目标函数值的模糊规则分类到类别zp中;模糊规则分类得到的第p个智能体的类别zp为: 其中fTmax和fTmin分别是加权总目标函数值的最大值和最小值,子集A、B、C和D是四个模糊逻辑子集,子集A到D分别具有Hagent,A、Hagent,B、Hagent,C和Hagent,D个智能体,0<p≤Nagent;步骤16:为防止输入生成式对抗网络的数据被过度合成,选择每个子集中16%的个体进入两位量子通用门;每个被选中的个体通过一个两位量子通用门进入四个模糊子集,每个通用量子门Q1bit为: 其中,θ、λ和是费利克斯·布洛赫参数,θ为布洛赫球极角,为布洛赫球相对相位,λ为布洛赫球全局相位;双位量子通用门Q2bit是两个单位量子通用门的张量积,为: 其中Q1,1bit和Q2,1bit为两个单位量子通用门,θ1、θ2、λ1、λ2、和分别为Q1,1bit的布洛赫球极角、Q2,1bit的布洛赫球极角、Q1,1bit的布洛赫球全局相位、Q2,1bit的布洛赫球全局相位、Q1,1bit的布洛赫球相对相位和Q2,1bit的布洛赫球相对相位;步骤17:运用四个生成式对抗网络生成相应的决策变量值,为下一次迭代提供输入;首先将四个模糊子集对应的数据转化为图片数据,之后,以图片形式的四个模糊子集作为四个数据集输入到四个生成式对抗网络的判别器中,输入到每个生成式对抗网络的生成器中的噪声数据随机生成,当完成生成式对抗网络的训练目标后,输出生成器产生的数据作为下一次优化过程迭代的输入数据;生成式对抗网络由生成器和判别器两个部分组成,生成器的作用为生成与真实数据尽可能相似的数据;判别器是一个二分类器,作用是输出一个判别值,判断输入的数据是生成器生成的数据还是真实的数据;一组数据集xgan服从的概率分布为px,gan,设定随机噪声zgan服从的概率分布为pz,gan,则由生成器生成的数据表示为x′gan,概率分布为px′,gan;对于生成器而言,输入量为噪声zgan,训练目标是生成数据的概率分布px′,gan拟合真实数据的概率分布px,gan;对于判别器而言,输入量为真实数据xgan或生成数据x′gan,训练目标是输出一个判别值做到区分真实数据和生成数据;依据生成器和判别器的训练目标,得到生成器和判别器的损失函数LG,gan和LD,gan分别为: 其中,E为期望,表示真实数据xgan相关的期望,表示生成数据x′gan相关的期望;Dgan·为判别器的输出值;~表示数据服从对应的概率分布;生成器的训练目标是将LG,gan最小化;判别器的训练目标是将LD,gan最大化,即求解一个最大最小值优化问题;log是以10为底的对数函数;整个生成式对抗网络训练过程的目标函数为: 其中,Dgan和Ggan分别表示判别器和生成器的损失函数值;步骤18:将生成式对抗网络输出的决策变量限制在边界u表示决策变量的第u维元素,和分别表示第t时段决策变量的第u维元素的下限和上限;输出经过边界限制的决策变量值作为多层多目标分布式复制者动态一致性方法下一次迭代过程决策变量的初始值;步骤19:加速过程结束后,继续进行多层多目标分布式复制者动态一致性方法的个体策略选择和策略变化的迭代过程,当k=K时,结束该层的迭代,令Nl=Nl+1;步骤20:判断是否满足Nl=Nlayer,若不满足,则进入下一层的迭代,输出根据决策者偏好选出的帕累托最优解,输出的帕累托最优解的每一维元素作为下次迭代每个区域中所有智能体决策变量该维元素的总和,作为下一次迭代的一个约束条件;若满足,则输出该时间段的帕累托解集,令t=t+1;步骤21:当不满足Nl=Nlayer,进入下一层的迭代,将上层的每个区域分别进行分区的划分,划分出的每一个子区域作为该层迭代的初始智能体,若为最底层的迭代过程,则每一个拓扑点为一个智能体,在上层的每个区域分别选择一个领导者智能体,其它的作为跟随者智能体;步骤22:对每个分区进行并行的迭代过程,即对每个分区并行执行步骤4到步骤19,完成该层的迭代过程;步骤23:若满足Nl=Nlayer,则输出该时间段的帕累托解集,供决策者根据具体情况选取帕累托最优解,令t=t+1,进行下一段时间的迭代;步骤24:判断是否满足t≤ttotal,若满足,则继续执行下一时间段的迭代过程,若不满足,则方法结束,输出各时间段的帕累托解集。

全文数据:

权利要求:

百度查询: 广西大学 一种IES多模态分层多目标生成式对抗一致性优化加速方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。