【发明授权】一种基于近似集体策略和独立学习器的家庭微网群优化方法_三峡大学_202311694829.1

导航：龙图腾网> 最新专利技术> 一种基于近似集体策略和独立学习器的家庭微网群优化方法_三峡大学_202311694829.1

申请/专利权人：三峡大学

申请日：2023-12-08

公开（公告）日：2024-06-11

公开（公告）号：CN117833307B

主分类号：H02J3/32

分类号：H02J3/32;H02J3/14;H02J3/46;G06F18/20;G06F18/214;G06Q50/06

优先权：

专利状态码：有效-授权

法律状态：2024.06.11#授权;2024.04.23#实质审查的生效;2024.04.05#公开

摘要：本发明提供的一种基于近似集体策略和独立学习器的家庭微网群优化方法，包括如下步骤：S1、构建具有未知状态转移概率函数的马尔可夫博弈模型，最小化各个住宅用能成本的同时实现满足住户舒适度和避免变压器过载的目标；S2、在每个智能体中引入近似集体策略模型和独立学习器机制，构建MADRL模型；S3、基于MADRL模型对家庭微网群智能体进行离线训练和在线能量优化决策。该方法满足了现有RM群优化运行过程中局部可观测环境、高隐私性和高可拓展性的要求。

主权项：1.一种基于近似集体策略和独立学习器的家庭微网群优化方法，其特征在于，包括如下步骤：S1、构建具有未知状态转移概率函数的马尔可夫博弈模型，最小化各个住宅用能成本的同时实现满足住户舒适度和避免变压器过载的目标；马尔可夫博弈模型表达式如下：状态空间：RM群中各个子RM的智能体将根据本地观测结果做出调度决定，以满足住宅用户的用能需求，对于第个RM的智能体，在时段其观测到的环境状态定义为：其中，为第个RM中光伏发电单元在时段的输出功率；和分别为第个RM向配电网购买电能和出售电能的价格；为第个RM中固定负荷所需功率；为第个RM中储能系统在时段的荷电状态；为第个RM在时段的室外温度；和分别为第个RM中电动汽车和暖通空调的状态元组；动作空间：环境状态式中定义的观测仅构成了环境全局状态的子集，即智能体只能观测来自环境的部分信息，结合所有子RM的本地观测结果，时段RM群获得的全局状态被表示为：；第个子RM在时段的局部调度动作由与柔性可调度单元相关的功率输出组成，公式化为：；其中，为暖通空调的输出功率，具有制热和制冷两种运行模式；为电动汽车电池的充电或放电功率，表示存储在电池中或从电池释放的能量；为储能系统的充电或放电功率；同时，所述调度动作需满足以下运行约束条件：；；；在多智能体环境下，将RM群中所有子RM的联合调度动作进一步定义为：；奖励函数：将优化目标设定为最小化个调度时段内RM的总用能成本，同时避免影响住户的舒适度以及与配电网相连的变压器过载，设计的奖励函数由如下四部分组成：用能成本项、热不适惩罚项、里程焦虑惩罚项和变压器过载惩罚项；所述奖励函数的具体表达如下：用能成本项：第个RM智能体的用能成本项被设定为净用能成本，定义为：；其中，为储能系统的运行成本；为RM智能体与配电网功率交互的成本；为电动汽车充电和放电的电池退化成本；热不适惩罚项：将与区域温度偏差相关的热不适惩罚项定义为：其中，为暖通空调的设定温度值；为第个RM的室内温度；里程焦虑惩罚项：将里程焦虑惩罚项定义为：其中，为电动汽车电池存储电能的容量；为时段电动汽车电池中存储的电能；为电动汽车的到达住宅的时刻，电动汽车离开的时刻为；变压器过载惩罚项：依据每个子RM对于RM群总电能需求的贡献，将变压器过载惩罚定义为：其中，为第个RM在时段与配电网交互的功率，可由功率平衡等式计算得到；为变压器处的总功率，定义为；为时段变压器的可用容量；综合上述四部分的描述，时段智能体的奖励可表示为：其中，、和分别为热舒不适度惩罚项、里程焦虑惩罚项和变压器过载惩罚项的权重因子；S2、在每个智能体中引入近似集体策略模型和独立学习器机制，构建MADRL模型；S3、基于MADRL模型对家庭微网群智能体进行离线训练和在线能量优化决策。

全文数据：

权利要求：

百度查询：三峡大学一种基于近似集体策略和独立学习器的家庭微网群优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：对准失真的图像_ASML荷兰有限公司_202280075359.8

下一篇：一种油溶性石墨烯的制备方法_重庆烯达科技有限公司_202410279749.8

相关技术

对准失真的图像_ASML荷兰有限公司_202280075359.8

一种油溶性石墨烯的制备方法_重庆烯达科技有限公司_202410279749.8

用于提供更新的机器学习算法的系统和方法_西门子医疗有限公司_202311623232.8

紧急救援呼救方法、装置、系统及车辆_长城汽车股份有限公司_202410325030.3

一种机房巡检机器人控制方法及系统_广州申迪智能科技有限公司_202311823017.2

一种自润滑长寿命硬质合金串珠及其制备方法和应用_郑州机械研究所有限公司_202311466192.0

一种智能拍背装置_中日友好医院(中日友好临床医学研究所)_202410324763.5

水处理机和用于水处理机的控制阀_余姚市亚东塑业有限公司_202311753429.3

一种化学发光免疫分析仪的试剂仓_山东中鸿特检生物科技有限公司_202410659557.X

用于处理车辆的路径选择的方法和系统_沃尔沃卡车集团_202311739282.2

一种功能分级的智能分注管柱及使用方法_中国石油化工股份有限公司_202211701478.8

光学系统和包括该光学系统的相机模块_LG伊诺特有限公司_202280073239.4

学习相关技术

通过逆向强化学习的人类技能学习_发那科株式会社_202311717238.1

一种基于多层次增强对比学习的慕课学习者学习成效预测方法_华中师范大学_202410337219.4

基于补丁匹配度量的语义交互元学习网络及学习方法_西北工业大学_202410198101.8

一种基于智能学习机的学习进度自适应跟进系统_山东金声教育科技有限公司_202410387512.1

一种基于课程学习的图像分类的增量学习方法_西北工业大学_202410254888.5

一种英语学习助记器_盐城师范学院_202322721576.4

综合思维能力学习装置_可丽普株式会社_202110859201.7

一种学习机_深圳市锐族数码科技有限公司_202322594024.1

强化学习的方法和装置_华为技术有限公司_202010308484.1

一种新型学习教具_青岛滨海学院_202322503391.6

家庭相关技术

一种家庭储能电池包_深圳福安新能源有限公司_202323067032.7

一种可调式家庭健身器材墙板_任丘市康瑞达体育器材有限公司_202322521821.7

一种组建家庭影院方法、设备及系统_华为技术有限公司_202211644507.1

基于骨质疏松性骨折患者家庭护理用体位辅助变换器_武汉科技大学_202322820830.6

家庭负载供电方法与装置、及电池充电方法与装置_惠州市乐亿通科技股份有限公司_202410384271.5

一种阳台式家庭农场组培式装置_湖州南浔国鑫家庭农场有限公司_202410254231.9

一种用于家庭制氧机的四缸活塞压缩机_河北康圣捷医疗科技有限公司_202322755342.1

基于FTTR的家庭安防监控方法、系统、介质及设备_四川天邑康和通信股份有限公司_202410240801.9

一种适用于农村家庭生活排水系统垃圾过滤装置_山东兴泰管业有限公司_202322946686.0

一种家庭用蹦床_田辉_202322991948.5

器相关技术

滤波器及双工器_武汉敏声新技术有限公司_202410461548.X

绕线器_东莞市盛维塑胶制品有限公司_202322913241.2

清洁器_赵贺伟_202323127852.0

保质器_江苏丰尚智能科技有限公司_202323344916.2

打结器_北京迈迪顶峰医疗科技有限公司_201811526324.3

感测器控制器和包括感测器控制器的显示装置_三星显示有限公司_202311654956.9

一种防止输液器脱落的固定器及输液器_四川省医学科学院·四川省人民医院_202421177589.8

飞行器天线、飞行器机身和飞行器_空中客车德国运营有限责任公司_202311773064.0

空调器的控制方法、控制器、空调器及存储介质_广东美的制冷设备有限公司_202210737632.0

偏振滤光器和集成这种滤光器的偏振图像传感器_原子能与替代能源委员会_202311747757.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于近似集体策略和独立学习器的家庭微网群优化方法_三峡大学_202311694829.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务