首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于人工智能的污水处理监管方法及系统_葛洲坝集团生态环保有限公司;中国葛洲坝集团水务运营有限公司_202410357619.1 

申请/专利权人:葛洲坝集团生态环保有限公司;中国葛洲坝集团水务运营有限公司

申请日:2024-03-27

公开(公告)日:2024-06-21

公开(公告)号:CN117952326B

主分类号:G06Q10/063

分类号:G06Q10/063;G06Q50/26;G06F18/214;G06F18/23213

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.05.17#实质审查的生效;2024.04.30#公开

摘要:本发明公开了基于人工智能的污水处理监管方法及系统,方法包括:数据采集、数据预处理、平衡数据集、构建污水处理监管模型和实时监管。本发明属于数据处理技术领域,具体是指基于人工智能的污水处理监管方法及系统,本方案根据聚类有效性判断动态确定最佳簇数量,根据数据和簇质心之间的距离和相似度两种角度抽取数据,构建平衡数据集;计算梯度和第一动量之间的相似性,引入自适应系数和自适应控制系数调整训练参数,并引入了缩放机制,完成神经网络参数的更新,得到污水处理监管模型。

主权项:1.基于人工智能的污水处理监管方法,其特征在于:该方法包括以下步骤:步骤S1:数据采集;步骤S2:数据预处理;步骤S3:平衡数据集,根据聚类有效性判断动态确定最佳簇数量,根据数据和簇质心之间的距离和相似度两种角度抽取数据,构建平衡数据集;步骤S4:构建污水处理监管模型,计算梯度和第一动量之间的相似性,引入自适应系数和自适应控制系数调整训练参数,并引入了缩放机制,完成神经网络参数的更新,得到污水处理监管模型;步骤S5:实时监管;在步骤S3中,所述平衡数据集具体包括以下步骤:步骤S31:确定最佳簇数量,令簇数量k分别等于2到Nmin,Nmin是少数类样本集中的数据数量,使用簇数量k从初始值2对多数类样本集进行迭代聚类,根据聚类结果确定最佳簇数量,包括以下步骤:步骤S311:聚类,使用K-Means聚类方法将多数类样本集划分为k个簇,得到簇集合C={C1,…,Ci,…,Ck},C1、Ci和Ck分别是第1个簇、第i个簇和第k个簇,i是簇索引,i=1,2,…,k;步骤S312:计算最小簇中数据数量,计算每个簇中的数据数量,得到最小簇的数据数量,是第i个簇中的数据数量;步骤S313:聚类有效性判断,从每个簇中抽取的数据数量大于等于2时,使用簇数量k进行的聚类具备有效性;否则,使用簇数量k进行的聚类不具备有效性,Nmax是多数类样本集中的数据数量;步骤S314:计算最佳簇数量,当使用簇数量k进行的聚类具备有效性,令k加1,转至步骤S311进行迭代;否则,最佳簇数量kbest=k-1,并转至步骤S32;步骤S32:最佳聚类,使用K-Means聚类方法将多数类样本集划分为kbest个簇,得到最佳簇集合E={E1,…,Ea,…,Ekbest}、簇质心集合F={F1,…,Fa,…,Fkbest}和簇数据量集合U={U1,…,Ua,…,Ukbest},E1、Ea和Ekbest分别是使用最佳簇数量kbest进行聚类得到的第1个簇、第a个簇和第kbest个簇,F1、Fa和Fkbest分别是使用最佳簇数量kbest进行聚类得到的第1个簇、第a个簇和第kbest个簇的质心,U1、Ua和Ukbest分别是使用最佳簇数量kbest进行聚类得到的第1个簇、第a个簇和第kbest个簇中的数据数量,a是使用最佳簇数量kbest进行聚类得到的簇索引,a=1,2,…,kbest;步骤S33:构建抽样数据集,从每个簇内抽取数据构建抽样数据集;步骤S34:构建平衡数据集,将抽样数据集和少数类样本集进行组合得到平衡数据集;在步骤S33中,所述构建抽样数据集,是基于从每个簇内抽取的数据构建抽样数据集,从第a个簇中抽取数据包括以下步骤:步骤S331:计算簇需要抽取的数据数量,所用公式如下: ;式中,是第a个簇需要抽取的数据数量;步骤S332:计算数据和簇质心之间的距离,基于距离大小将簇中数据进行升序排序,计算距离所用公式如下: ;式中,dab是第a个簇中第b个数据与第a个簇质心之间的距离,o是特征维度索引,h是特征维度大小,是第a个簇中第b个数据在第o维特征的值,是第a个簇质心在第o维特征的值;步骤S333:计算数据和簇质心之间的相似度,基于相似度大小将簇中数据进行降序排序,计算距离所用公式如下: ;式中,cos(zab,Fa)是第a个簇中第b个数据与第a个簇质心之间的相似度;步骤S334:数据抽取,从第a个簇中抽取升序排序后与簇质心之间的距离小的前个数据和降序排序后与簇质心之间的相似度大的前个数据;在步骤S4中,所述构建污水处理监管模型是构建神经网络,神经网络包括输入层、输出层和隐藏层,输入层接收平衡数据集中的数据,隐藏层进行数据处理和特征提取,输出层输出评估标签,具体包括以下步骤:步骤S41:计算损失函数的梯度,所用公式如下:gt=∇wL(fx;wt),y;式中,gt是第t次训练时损失函数的梯度,∇wL是损失函数L对参数w的梯度,fx;wt)是神经网络在给定输入数据x和第t次训练时的神经网络参数wt下输出的预测标签,y是输入数据x的真实标签,t是训练次数索引;步骤S42:计算相似性,所用公式如下: ; ;式中,D是梯度gt的维度,qt是第t次训练时损失函数的梯度和第一动量之间的相似性,j是维度索引,gt,j是第t次训练时损失函数的梯度在第j维度的值,mt,j是第t次训练时第一动量在第j维度的值,vt,j是第t次训练时第二动量在第j维度的值,ε是防止分母为0的极小正数,Dimensions(·)是计算向量维度的函数;步骤S43:计算自适应系数,所用公式如下: ; ;式中,β1,t是第t次更新时的自适应系数,Qt-1和Qt-2分别是从第1次训练时的相似性到第t-1次训练和第t-2次训练时的相似性的加权和,β1是自适应系数的初值,qt-1是第t-1次训练时损失函数的梯度和第一动量之间的相似性;步骤S44:更新第一动量和第二动量,所用公式如下: ; ;式中,mt+1和mt分别是第t+1次训练和第t次训练时的第一动量,vt+1和vt分别是第t+1次训练和第t次训练时的第二动量,β2是衰减率,是β1,t的平方;步骤S45:偏置校正第一动量,所用公式如下: ;式中,是偏置校正后的第一动量;步骤S46:计算自适应控制系数,所用公式如下: ; ;式中,ρt是第t次训练时的自适应控制系数,ρmax是自适应控制系数的最大值,是β2的t次方;步骤S47:缩放,缩放偏置校正后的第一动量,所用公式如下: ; ; ;式中,是缩放后的第一动量,是自适应控制系数的缩放比例,是梯度的缩放比例,gt-1是第t-1次训练时损失函数的梯度,和分别是ρt和ρmax的平方,σt和μt分别是|gt-gt-1|的平均值和标准偏差,λ1和λ2分别是第一控制系数和第二控制系数,是σt的λ1次方;步骤S48:更新神经网络参数,所用公式如下: ;式中,wt+1是第t+1次训练时的神经网络参数,α是学习率;步骤S49:模型构建,预先设定最大训练次数T,当达到最大训练次数T时,基于当前神经网络参数构建神经网络,得到污水处理监管模型;否则继续进行迭代训练。

全文数据:

权利要求:

百度查询: 葛洲坝集团生态环保有限公司;中国葛洲坝集团水务运营有限公司 基于人工智能的污水处理监管方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。