首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于强化学习与注意力机制的非介入式负荷监测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:吉林大学

摘要:基于强化学习与注意力机制的非介入式负荷监测方法,属于电力负荷监测技术领域,解决了现有深度学习网络无法在小参数规模下保证其在含有多状态电器的家庭负荷监测场景下的精度的问题。对评估演员网络、评估评论网络、目标演员网络、目标评论网络、参数和环境初始化;评估演员网络与环境交互,将交互结果存入缓存区;缓存区数据批量采样,将采样数据送入评估演员网络、评估评论网络、目标演员网络和目标评论网络,得到结果;根据得到的结果计算损失,根据损失优化评估评论网络,计算出评估演员网络的损失,更新评估演员网络;依据评估评论网络对目标评论网络进行软更新,评估演员网络对目标演员网络进行软更新。

主权项:1.基于强化学习与注意力机制的非介入式负荷监测方法,其特征在于,包括以下步骤:步骤S1,对评估演员网络、评估评论网络、目标演员网络、目标评论网络、多个参数和环境分别进行初始化;步骤S2,评估演员网络与环境进行交互,并将交互结果存入缓存区;步骤S3,对缓存区中数据进行批量采样,并将采样数据分别送入评估演员网络、评估评论网络、目标演员网络和目标评论网络,得到结果;步骤S4,根据步骤S3得到的结果计算损失,并根据损失优化评估评论网络,采用优化后评估评论网络计算出评估演员网络的损失,更新评估演员网络;步骤S5,依据评估评论网络对目标评论网络进行软更新,评估演员网络对目标演员网络进行软更新;步骤S6,判断步骤S5获得的评估演员网络、评估评论网络、目标演员网络和目标评论网络是否满足终止训练条件,若是,则执行步骤S7,若否,则执行步骤S2~S6;步骤S7,对评估演员网络、评估评论网络、目标演员网络和目标评论网络分别进行剪枝操作;所述的评估演员网络和目标演员网络包括:若干层一维卷积网络、若干个由注意力机制层和全连接网络组成的单元,以及全连接网络;负荷数据在注意力机制模型和卷积神经网络组合的结构中处理具体过程为:步骤S1001,负荷数据即st与st+1经过m层一维卷积网络,得到卷积数据D,其中卷积核参数和层数可根据数据特性调整;步骤S1002,负荷数据经过两层由注意力机制和全连接网络组成的模块;在该模块中,注意力机制层将卷积后数据D分别乘以注意力机制模块中的矩阵Mq、Mk和Mv得到Q、K和V,即:Q=DTMq;K=DTMk;V=DTMv;其中,DT为卷积后数据的转置,Q为查询矩阵,K为关键字矩阵,V为价值矩阵;步骤S1003,注意力机制层使用公式: 其中,C为输出结果,d为超参数,QT为查询矩阵的转置,其中超参数d可根据参数实际情况调整;Softmax函数定义为: 其中,x为输入向量,N为x中元素的个数;步骤S1004,该模块将C送入全连接网络处理,得到C′即:C′=FCNC;其中,C′为全连接网络处理后的输出;其数学表达如下:FCNC=ReLUCW1+b1W2+b2;其中,C为输入数据,b1、b2分别为第一、二层全连接网络偏置矩阵,W1、W2分别为第一、二层全连接网络参数矩阵;ReLU函数为激活函数,表达式为:ReLUx=max0,x,x为输入数据;步骤S1005,将经过先前两个模块处理的数据C′送入最后一层全连接网络。

全文数据:

权利要求:

百度查询: 吉林大学 基于强化学习与注意力机制的非介入式负荷监测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。