【发明授权】基于深度强化学习动态定价的VPP内部能源优化方法及系统_东南大学_202311355656.0

导航：龙图腾网> 最新专利技术> 基于深度强化学习动态定价的VPP内部能源优化方法及系统_东南大学_202311355656.0

申请/专利权人：东南大学

申请日：2023-10-18

公开（公告）日：2024-06-21

公开（公告）号：CN117559387B

主分类号：H02J3/00

分类号：H02J3/00;G06Q10/0631;G06Q30/0283;G06Q50/06;G06N3/04;G06N3/092;H02J3/46

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2024.03.01#实质审查的生效;2024.02.13#公开

摘要：本发明公开了一种基于深度强化学习动态定价的VPP内部能源优化方法及系统，首先输入基础数据，建立双层日前能量管理框架：所述框架包括上下两层，在上层中，VPP运营商向DER发送内部价格信号；在下层中，DER接收来自上层VPP运营商的价格信号，实现个人利润最大化的前提下进行调度决策，并将决策信号传送回VPP操作员；建立强化学习模型：采用柔性动作‑评价算法SAC作为无模型强化学习RL算法，通过在线学习在多维状态环境中进行最优的多维连续决策变量；最后在强化学习模型基础下进行VPP操作，实现内部能源的最佳调度。

主权项：1.基于深度强化学习动态定价的VPP内部能源优化方法，其特征在于,包括如下步骤：S1，数据输入：输入基础数据，所述基础数据至少包括电力市场价格数据、负荷预测数据、VPP内部设备状态数据和可用能源资源的数据；S2，建立双层日前能量管理框架：所述框架包括上下两层，在上层中，VPP运营商向DER发送内部价格信号，代表发电和减载的购买和销售价格，所述内部价格信号至少包括风力发电、需求响应、分布式柴油发电和电池存储的内部价格信号，VPP运营商的内部采购价格是上层的决策变量，其进行内部价格信号决策变量的日前优化目标如下：其中，Ct,i是t时刻从第i类DER购买电力的成本之和；λgrid是预测电价；Pt,i是VPP运营商向外部电力市场出售聚合电力；T是总时间点数；N是DER总类数；R为优化目标；所述内部采购价格还受外部电力市场的限制，外部市场的总投标能力受到容量最大转移容量Pmax的限制，具体为：0≤λt,i≤λgrid 其中，Pmax为最大转移容量；Pt,i为第i类资源功率；λt,i为第i类资源内部采购价格；λgrid为预测电价；在下层中，DER接收来自上层VPP运营商的价格信号，实现个人利润最大化的前提下进行调度决策，并将决策信号传送回VPP操作员；下层框架中，每个DER的收入包括从VPP运营商获得的分配收入和相应的运营成本，根据价格信号，每个DER确定发电量、充电状态和减载，以实现个人利润最大化；VPP运营商和可再生能源发电之间，可再生能源发电按单位发电量进行奖励，风力发电日前进行风力发电预测，并通过削减额外功率来决定VPP的发电量，所述风力发电的利润最大化目标如下：其中，πt,w为风力发电的利润；Pt,w为以合同价格提供的风力发电量；λt,w为合同价格；Cpen为t时刻功率预测的不确定性相关的惩罚系数；Ccurl为与风电场决定不贡献的缩减功率量相关的弃电成本系数；下层框架中，VPP运营商与柴油发电之间，根据利润最大化函数来决定当时的发电量；对于分布式柴油发电，目标是在考虑发电成本的情况下实现利润最大化，具体如下：其中πt,D为利润；Gt,D为柴油发电量；λt,D为t时刻柴油发电的内部价格；CD为柴油发电非适参数；柴油发电的运行约束如下：0≤Gt,D≤GD,max其中，GD,max为最大发电量；Gt,D为t时刻柴油发电量；下层框架中，VPP运营商与电池存储之间，将根据VPP操作员发出的内部价格信号和t-1时的电池状态来决定充电或放电量，目标是使放电利润和充电成本之间的差异最大化，具体为：其中，πbat,t为发电的利润；Qbat,t与Qbat,t0为电池充放电决策变量，受到充电和放电最大容量的限制，λbat,t是t时刻内部价格信号；λbat,t0是t-1时刻内部价格信号；S3，建立强化学习模型：采用柔性动作-评价算法SAC作为无模型强化学习RL算法，通过在线学习在多维状态环境中进行最优的多维连续决策变量；S31：在柔性动作-评价算法SAC中，通过用熵项增加期望的奖励之和其中st为特定状态环境；at为特定状态环境下的动作；π为策略；将标准学习目标推广到最大熵目标，使得最优策略除了在每个状态下的奖励外，最大化熵；S32：建立柔性动作-评价算法SAC，指示从状态s开始、采取行动并遵循政策的预期贴现率的Q函数定义为：其中，st为t时刻特定状态环境；at为t时刻特定状态环境下的动作；π为策略；α为温度参数，决定熵项相对于奖励的重要性，从而控制最优策略的随机性；γ为折扣率；S4：在步骤S3的强化学习模型基础下进行VPP操作，实现内部能源的最佳调度。

全文数据：

权利要求：

百度查询：东南大学基于深度强化学习动态定价的VPP内部能源优化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种优化音频输出噪声的设备_深圳市伏荣科技开发有限公司_202323210109.1

下一篇：一种纸尿裤生产用包边机_广东乐臣卫生用品有限公司_202322807597.8

相关技术

一种优化音频输出噪声的设备_深圳市伏荣科技开发有限公司_202323210109.1

一种纸尿裤生产用包边机_广东乐臣卫生用品有限公司_202322807597.8

一种数控机床主轴箱冷却装置_莆田市华睿机械有限公司_202322982197.0

一种纸箱印刷机用送料装置_山东今海印包装有限公司_202322887808.3

混料搅拌装置_点滴(南京)生物科技有限公司_202322819995.1

一种地铁车辆车钩检修用辅助工具_郑州地铁集团有限公司_202323220198.8

一种安装工具_天津海纳星辉科技有限公司_202322791439.8

一种用于光伏发电装置的R型回转减速机_无锡天昀新能源科技有限公司_202323183045.0

一种叠加机_浙江锐格物流科技股份有限公司_202322839261.X

一种水利施工用混凝土搅拌装置_江西省裕丰水利水电建设有限公司_202322951785.8

一种螺旋输送装置_荆州洪川饲料有限公司_202322725014.7

一种带固定结构的冲压装置_天津众兴腾达电子有限公司_202322781917.7

定价相关技术

一种多媒体数据定价处理方法及装置_湖南工商大学_202410386442.8

基于模型构建的产品定价方法、装置、设备及存储介质_中国平安财产保险股份有限公司_202210583177.3

可替代产品的多期联合库存和定价决策方法_中国科学技术大学_202410385575.3

一种大型综合体配建停车场内差异化定价策略制定方法_东南大学_202111325658.6

一种考虑交通网和配电网耦合运行的充电网络运营商动态定价方法_国网山西省电力公司临汾供电公司_202410442709.0

一种应用于汽车保险定价的多目标优化方法及终端_西安电子科技大学广州研究院_202311868143.X

一种图像计量定价方法_国网重庆市电力公司电力科学研究院_202111517408.2

定价规则配置方法、装置、设备及存储介质_中国建设银行股份有限公司_202410420423.2

基于深度强化学习动态定价的VPP内部能源优化方法及系统_东南大学_202311355656.0

基于微服务框架的重定价方法、装置、设备、介质及产品_中国建设银行股份有限公司_202410283201.0

内部相关技术

侧梁的内部结构_杰富意钢铁株式会社_202280076174.9

管道内部腐蚀监测方法及其应用_江苏省特种设备安全监督检验研究院_202410430790.0

eMMC内部信息分析方法和系统_珠海妙存科技有限公司_202310446673.9

一种车辆内部结构及改变车辆内部结构的布局的方法_佛吉亚(中国)投资有限公司_202211693189.8

一种便于更换内部元件的环网柜_江西同源电力设备有限公司_202322867704.6

一种过滤膜组内部导流结构_北京上远科技有限公司_202323127029.X

一种勘探管道内部的设备_尚元元_202322866822.5

一种内部空间可调的育苗架_武汉市金水关山生态农业有限公司_202323013570.8

一种汽车内部防雾阅读灯_格尔翰汽车配件(东莞)有限公司_202322557948.4

一种便于内部清洗的反应釜_天津市静海县亚太工业有限公司_202323075632.8

VPP相关技术

基于vpp框架的TSN时间同步方法及装置、介质、设备_浪潮通信技术有限公司_202410488531.3

基于改进式生成对抗网络GAN的VPP调度优化方法及系统_广西电网有限责任公司电力科学研究院_202410300407.X

基于量子遗传算法的VPP调频决策优化方法、装置及设备_南方电网能源发展研究院有限责任公司_202410314459.2

基于聚类的VPP电动车安全调度优化方法、装置及设备_南方电网能源发展研究院有限责任公司_202410315108.3

应用于VPP场景的建筑电力负荷预测方法、装置及系统_上海电力设计院有限公司_202410235017.9

基于VPP需求响应的柔光储充系统联合调控方法及系统_广州高新区能源技术研究院有限公司_202311333816.1

一种基于日志的VPP配置恢复方法、系统、介质及设备_明阳产业技术研究院(沈阳)有限公司_202310065963.9

一种基于VPP的保障带宽的系统及方法_成都安恒信息技术有限公司_202111406330.7

一种数据转发方法、VPP网元设备和可读存储介质_天翼云科技有限公司_202210910756.4

一种基于VPP的双层VXLAN隧道封装方法_天翼云科技有限公司_202311703084.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】基于深度强化学习动态定价的VPP内部能源优化方法及系统_东南大学_202311355656.0

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务