基于Transformer改进深度强化学习的多目标多水库调度优化方法

导航：龙图腾网> 最新专利技术> 基于Transformer改进深度强化学习的多目标多水库调度优化方法

申请/专利权人：南京航空航天大学

申请日：2023-06-01

公开（公告）日：2024-04-26

公开（公告）号：CN117236478B

主分类号：G06Q10/04

分类号：G06Q10/04;G06Q10/067;G06Q10/0631;G06Q50/06;G06N3/0455;G06N3/092

优先权：

专利状态码：有效-授权

法律状态：2024.04.26#授权;2024.01.02#实质审查的生效;2023.12.15#公开

摘要：本发明公开了一种基于Transformer改进深度强化学习的多目标多水库调度优化方法，该方法首先获取水库运行的基本数据，然后由此建立多目标水库的优化调度模型，以调度期间的发电量最大、AAPFD值最小以及供水收益最大作为运行优化的目标，进一步的在约束条件下进行算法寻优，包括编码、解码和训练过程。该方法以平水年数据作为运行的实例，对每个水库每个月的发电流量和供水水流量进行优化，在保证各水库能够安全运行的前提下，提高发电量以及送水收益并降低AAPFD值。

主权项：1.一种基于Transformer改进深度强化学习的多目标多水库调度优化方法，其特征在于：将水库发电量最大、修正后的年比例流量偏差值AAPFD最小以及居民区送水收益最大作为优化目标，包括建立多目标水库调度模型，还包括对每个水库每个月的发电流量和供水水流量进行优化；所述方法步骤如下：1获取水库运行的基本数据，包括库容与水位的关系、月均水流出流量、最低最高水位线、每月水位线、水库月均流入流量，根据水库运行的基本数据建立考虑水库水位线、发电流量、居民区送水流量约束的多目标多水库优化调度模型；2设计多目标多水库运行调度的约束条件，包括水平衡约束、水位线约束、发电量约束、供水量约束、初始状态约束以及水位线和储存量之间的非线性约束；3求解多目标多水库优化调度模型，包括设置发电总量、AAPFD值和供水总收益的权重，并在该权重组合下将多目标优化问题分解为M个子问题，M个子问题采用邻居的参数迁移策略来进行合作计算，在训练的过程中，上一个子问题训练的网络参数将会作为下一个子问题的网络初始参数，据此完成对于水库的解码过程、编码过程和训练过程；所述的编码过程如下：1对最大最小的发电量以及流入流量进行编码得到Embedding1；2对Embedding1的输出以及当前水库的水位线进行编码，并通过残差连接获得嵌入了所有用于发电所需信息的嵌入Embedding2；3对每个居民区的最大和最小供水量进行编码，得到Embedding3；4将Embedding1、Embedding3以及居民区与水库之间的距离、目前水库的供水量和水库目前的水位线进行编码，得到该水库对每个居民区用于供水的嵌入Embedding4；对于Embedding1，其表达式如下：其次，采用多头注意力层去处理Embedding1，并将其映射到一个keykit、queryqit以及valuevit，自注意力层的输出通过将qiu以及其他viu之间的归一化加权计算得到：式中，为Embedding1解码后的输出，qi为对应节点的query，ku′为其他节点的key；所述的解码过程是将多目标多水库调度优化建模成一个马尔科夫决策过程，包括智能体、状态集合S、动作集合A，所述的动作集合A包含用于选择发电流量的动作集合Ap，决定是否进行供水的动作集合Ax以及选择供水流量的动作集合As；对于每个水电站水库i，在每个时间段t内，首先根据Embedding2选择用于发电的流量接着通过流入流量以及发电流出流量更新Lit，并通过此时的Lit，lij，Wjt计算嵌入Embedding4，根据这个嵌入选择是否进行供水xijt，如果xijt不为0，选择用于供水的流量否则令重复上述步骤直至实现所有的水库在所有时段的发电与供水决策，如果决策能够满足约束条件的话，将回报如下赋值：式中，Ra为第a个子问题的回报；分别表示三个目标函数的最大最小值，这些值由单目标的T-DRL得到；如果不能够满足约束条件的话，将回报置为0；所述的训练过程中，策略梯度法被用来训练神经网络中的参数θ，计算优势估计函数：ADVi＝Rπi-RπBL式中，RπBL为通过基线模型得到的回报；接着，更新参数通过：式中，B为训练的批量，采用配对的t检验比较θ和θBL，如果结果在95％置信度水平上显著，则用θ代替θBL。

全文数据：

权利要求：

百度查询：南京航空航天大学基于Transformer改进深度强化学习的多目标多水库调度优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种隐框式岩板蜂窝复合板

下一篇：一种砻谷机风选取粮器

相关技术

一种隐框式岩板蜂窝复合板

一种砻谷机风选取粮器

一种用于光伏发电装置的R型回转减速机

一种巡检方便的电容补偿柜

一种隔音效果好的橡塑制品

一种纸面石膏板加工用除尘装置

一种生态护坡绿化模块

电芯和电子设备

一种梳棉机用棉条桶

一种可移动式智能温控糖化槽生产线

一种空调器自清洁系统油污沉淀装置

一种水利施工用混凝土搅拌装置

学习相关技术

一种面向情境学习的机器学习模型训练的方法及系统_广东电网有限责任公司_202410368726.4

基于儿童学习偏好和智能教练的自适应学习方法和系统_昫爸教育科技(北京)有限公司_202310980805.6

节气门开度传感器的学习装置及学习方法_株式会社三国_202311446617.1

存储器优化的对比学习_谷歌有限责任公司_202280076446.5

机器学习辅助的图像预测_苹果公司_201980070345.5

用于持续学习的方法和装置_罗伯特·博世有限公司_202180103671.9

一种在线视频学习中学习者注意状态智能检测系统及方法_陕西师范大学_202110305497.8

管理使用机器学习过程训练的模型_皇家飞利浦有限公司_202280073390.8

深度学习加速器系统及其方法_阿里巴巴集团控股有限公司_201980009631.0

一种挂脖式学习机_佛山市生命树文化传播有限公司_202322058516.9

目标相关技术

动态滑移目标牵引控制_瑞维安知识产权控股有限责任公司_202311045322.3

一种基于知识蒸馏的目标检测方法及目标检测终端_庆阳瑞华能源有限公司_202111048823.8

目标检测模型训练方法、目标检测方法以及电子设备_苏州浪潮智能科技有限公司_202210111173.5

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

小样本目标检测方法和装置_华南师范大学_202410537281.8

目标识别方法和装置_杭州海康威视数字技术股份有限公司_201910769052.8

目标对象处理方法以及装置_浙江网商银行股份有限公司_202110891910.3

基于目标检测器与度量矩阵的遥感图像目标实例变化检测方法和设备_哈尔滨工业大学_202410297963.6

一种目标光栅生成方法_上海频准激光科技有限公司_202410452420.7

一种目标跟踪方法及装置_苏州万集车联网技术有限公司_202211699251.4

强化相关技术

用于软组织增强和强化的支架_斯玛特费姆医疗技术私人有限公司_202280058474.4

基于中心区域强化的乳腺肿块检测装置_中南民族大学_202410379358.3

强化方法、不等厚柔性玻璃和电子设备_深圳市锐尔觅移动通信有限公司_202211701495.1

一种超声强化研磨装置_广州大学_202410516187.4

一种行星轮式钢球强化研磨装置_无锡金牛钢球有限公司_202410670889.8

一种锁扣式强化地板_安徽扬子地板股份有限公司_202322730769.6

一种强化烟气循环烧结的方法_武汉钢铁有限公司_202410375407.6

环氧树脂组合物、含有强化纤维的环氧树脂组合物、预浸料及使用它们的纤维强化塑料_日铁化学材料株式会社_202311791034.2

基于深度强化学习的分布式计算卸载方法及装置_湖南大学_202210120047.6

一种基于强化学习的分层式区域协调信号控制方法_东南大学_202410354348.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于Transformer改进深度强化学习的多目标多水库调度优化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务