【发明授权】一种基于纳什Q学习的微电网群互动博弈策略学习进化方法_中国科学院电工研究所_202310083666.7

申请/专利权人：中国科学院电工研究所

申请日：2023-02-08

公开（公告）日：2024-06-21

公开（公告）号：CN116050632B

主分类号：G06Q10/04

分类号：G06Q10/04;H02J3/00;G06Q50/06;G06F30/27;G06N20/00;G06F113/04

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2023.05.19#实质审查的生效;2023.05.02#公开

摘要：本发明提供一种基于纳什Q学习的微电网群互动博弈策略学习进化方法，包括：考虑多主体利益诉求与微电网群互动约束，构建微电网群互动博弈模型，使用交替方向乘子分布式优化算法松弛问题为全局优化问题求解近似均衡解；基于步骤1求得的近似均衡解，构建近似均衡解驱动的Q‑Learning强化学习训练机制；构建微电网群策略强化学习的动作空间，状态空间和价值函数；基于纳什均衡近似解的迁移学习方法加速强化学习训练和多微电网群互动博弈均衡解求解过程。本发明充分利用历史求得的近似均纳什衡解集，实现微电网群互动运行策略的学习，显著提高历史数据的利用与强化学习的训练效率，加速微电网群互动博弈策略的学习。

主权项：1.一种基于纳什Q学习的微电网群互动博弈策略学习进化方法，其特征在于，包括以下步骤：步骤（1）考虑多主体利益诉求与微电网群互动约束，构建微电网群互动博弈模型，使用交替方向乘子法松弛问题为全局优化问题，求解近似均衡解，包括：步骤（1-1）针对参与互动博弈的综合能源微电网利益目标，建立互动博弈的利益目标函数：对于微电网群，构建如下的利益目标函数： 1 2 3 4 5其中，为综合能源微网序号，为综合能源微网微的负荷经济收益，，，为为综合能源微网微的负荷收益系数，为综合能源微网微在时刻的负荷功率，为综合能源微网微的可再生能源上网收益，、分别为光伏和风电的上网电价的价格系数，为综合能源微网微在时刻的光伏发电与电网交易功率，为综合能源微网微在时刻的风力发电与电网交易功率，为时间段长度，为综合能源微网微的可再生能源运行维护成本，、分别为光伏和风电机组的运维成本的价格系数，为综合能源微网微在时刻的光伏发电功率，为综合能源微网微在时刻的风力发电功率，为综合能源微网微的燃机发电成本，，，为综合能源微网i的常规微燃机机组的成本系数，为综合能源微网微在时刻的微燃机出力功率；步骤（1-2）建立微电网群互动博弈消纳可再生能源的运行约束与设备物理约束，建立互动博弈的约束条件： 6 7 8 9 10 11其中，为综合能源微网在时刻的储能设备的荷电状态，，分别为储能设备的充电效率与放电效率，，分别为储能设备在时刻的充电功率与放电功率，为储能设备的最大容量，，分别为储能设备的充电功率最大值与放电功率最大值，，分别为储能设备荷电状态的最大值与最大值；步骤（1-3）引入拉格朗日函数，将求解博弈的纳什均衡问题转化为求解全局最优问题： 12 13 14 15 16 17 18其中，为优化目标函数的拉格朗日增广函数，是综合能源微网的优化变量，是所有综合能源微网群在第k次迭代时求解得到的解集除去之后的集合，是综合能源微网的总经济收益，是综合能源微网总数，是等式约束的变量前系数，是等式约束的常数，是求解以变量的函数最优解集，为变量的辅助变量，满足约束，是以为变量的的对偶函数，是时间段的最大值，为第次数迭代的拉格朗日乘子，为惩罚系数，和分别为第k次迭代时增广拉格朗日的互残差与自残差；步骤（1-4）使用交替方向乘子分布式优化算法求纳什近似均衡解，包括：1）设置最大迭代次数，收敛精度；初始化迭代次数，自变量，辅助变量，增广拉格朗日乘子和惩罚因子，其中，；2）对于微电网群主体，从各微电网群主体接收其期望售给电网的光伏发电功率和风电发电功率，根据优化目标及其约束构建其分布式优化的拉格朗日函数12，基于公式13依次求解微电网群各优化变量，包括负荷优化功率和微燃机出力功率；3）根据公式14构建各微电网群主体辅助变量与辅助变量对应的拉格朗日函数，根据公式15更新辅助变量；4）根据公式16更新拉格朗日乘子，根据公式17所示更新惩罚系数，更新迭代次数；5）根据公式18计算变量的互残差与自残差，判断算法收敛情况，如果满足迭代终止条件的公式19，否则返回2）重复计算，直至满足收敛条件或最大迭代次数； 19；步骤（2）基于近似均衡解，构建近似均衡解驱动的Q-Learning强化学习训练机制；构建微电网群策略强化学习的动作空间，状态空间和价值函数；步骤（3）基于纳什均衡近似解的迁移学习方法加速强化学习训练和多微电网群互动博弈均衡解求解过程。

全文数据：

权利要求：

百度查询：中国科学院电工研究所一种基于纳什Q学习的微电网群互动博弈策略学习进化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种羽毛片自动翻正装置_汪锐_202111663818.8

下一篇：一种汽车风窗玻璃试验中AB区的投射设备_中汽研汽车检验中心(武汉)有限公司_202410456408.3

相关技术

一种羽毛片自动翻正装置_汪锐_202111663818.8

一种汽车风窗玻璃试验中AB区的投射设备_中汽研汽车检验中心(武汉)有限公司_202410456408.3

一种物联网设备自动化测试系统、方法、存储介质及设备_成都秦川物联网科技股份有限公司_202210603550.7

老旧小区改造电梯加装用施工吊篮_四川华奥电梯有限公司_202210866326.7

一种镁合金阳极表面原位生成ZIF-8涂层的改性方法_桂林理工大学_202210904451.2

利拉鲁肽的合成_拜康有限公司_201780086325.8

一种配电网低压无功补偿电容状态检测方法及装置_广东电网有限责任公司_202210780379.7

一种汽车排气管制作加工焊接装置_潍坊鸿洋机械科技有限公司_202410431304.7

一种柔性低密度烧蚀防热涂料及其制备方法_上海箬宇新材料有限公司_202310043235.8

一种用于化纤在线取丝饼自动暂存的中转机器人_安歌科技(集团)股份有限公司_202210543752.7

烤烟烟叶面积的测量方法及系统_河南启迪睿视智能科技有限公司_202210505490.5

基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法_青岛科技大学_202410508360.6

学习相关技术

通过逆向强化学习的人类技能学习_发那科株式会社_202311717238.1

一种基于多层次增强对比学习的慕课学习者学习成效预测方法_华中师范大学_202410337219.4

基于补丁匹配度量的语义交互元学习网络及学习方法_西北工业大学_202410198101.8

一种基于智能学习机的学习进度自适应跟进系统_山东金声教育科技有限公司_202410387512.1

一种基于课程学习的图像分类的增量学习方法_西北工业大学_202410254888.5

一种英语学习助记器_盐城师范学院_202322721576.4

综合思维能力学习装置_可丽普株式会社_202110859201.7

一种学习机_深圳市锐族数码科技有限公司_202322594024.1

强化学习的方法和装置_华为技术有限公司_202010308484.1

一种新型学习教具_青岛滨海学院_202322503391.6

互动相关技术

一种互动徽章_佛山市咔通礼品有限公司_202322956032.6

虚拟对象互动方法及装置_卓世科技(海南)有限公司_202410511598.4

基于芯片感应技术的投影互动展项装置_鲁班艺术集团股份有限公司_202323007188.6

一种户外楼梯灯光互动装置_黎欧思照明(上海)有限公司_202322599051.8

一种自然互动式照明装置_黎欧思照明(上海)有限公司_202322598796.2

一种用于无线录播系统的互动终端_广州市锐星信息科技有限公司_202210756213.1

一种基于用户行为的智能互动式投影方法和装置_广州市广美电子科技有限公司_202410641915.4

基于智能锁的语音互动方法、装置、存储介质和系统_广东好太太智能家居有限公司_202410319483.5

一种社交账户的互动方法、装置、设备及存储介质_北京达佳互联信息技术有限公司_202110099278.9

一种基于VR技术的实景互动教学管理系统及方法_广东清正科技有限公司_202311356661.3

博弈相关技术

一种基于随机博弈的产消者点对点电能共享交易方法_中国科学院电工研究所_202211632595.3

基于贝叶斯博弈的需求响应电力市场优化控制方法及系统_南京南瑞信息通信科技有限公司_202410259229.0

基于联邦学习与联盟博弈的威胁情报分类方法及系统_中山大学_202410430615.1

基于主从双层博弈的分布式光伏集群管理方法和装置_国网山东省电力公司东营供电公司_202410433644.3

一种微分博弈制导策略的确定方法及装置_北京航空航天大学_202410232264.3

一种基于博弈论的多任务协作频谱感知方法_南京邮电大学_202210409873.2

一种基于演化博弈的车网互动市场电价及补贴制定方法_江苏省电力试验研究院有限公司_202410385409.3

一种基于纳什Q学习的微电网群互动博弈策略学习进化方法_中国科学院电工研究所_202310083666.7

基于可信协同合作博弈的多元混合智能云系统代价最小化资源分配方法_南京理工大学_202410471369.4

一种分布式协同作战场景下博弈制导策略的确定方法_北京航空航天大学_202410347249.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于纳什Q学习的微电网群互动博弈策略学习进化方法_中国科学院电工研究所_202310083666.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务