首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于假设检验的有限样本下数据驱动径流预报模型优选方法_长江勘测规划设计研究有限责任公司_202311000418.8 

申请/专利权人:长江勘测规划设计研究有限责任公司

申请日:2023-08-09

公开(公告)日:2024-05-28

公开(公告)号:CN117494862B

主分类号:G06Q10/04

分类号:G06Q10/04;G06Q50/26;G06F17/18;G06N5/04;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.05.28#授权;2024.02.23#实质审查的生效;2024.02.02#公开

摘要:本发明提供一种基于假设检验的有限样本下数据驱动径流预报模型优选方法,包括:建立径流与预报因子之间的映射关系,选择多个数据驱动模型对映射关系进行描述,建立备选模型集;对选择的模型假设率定模型参数,作为真实模型的总体估计;对总体的模型进行抽样,将样本集划分为训练集和测试集,对每一组划分方案进行模型率定和检验,得到预测精度的抽样分布;确定最佳样本集划分容量;计算测试集的预测精度以及统计量的观察值;根据统计量的观察值是否落在拒绝域,判断是否拒绝原假设;若存在多个备选模型均通过假设检验,基于“拒绝率最小”准则进行模型优选。本发明可验证预报模型对未知总体推断预测的可靠性,为预报模型的优选提供决策依据。

主权项:1.一种基于假设检验的有限样本下数据驱动径流预报模型优选方法,其特征在于,包括如下步骤:步骤1:根据历史径流资料和气象数据筛选预报因子,建立径流与预报因子之间的映射关系,选择多个数据驱动模型对所述映射关系进行描述,建立备选模型集;所述数据驱动模型由模型结构、参数、输入变量和输出变量组成,模型表达式如下:y=fX;ω+ε,ε~gθ式中,输入变量X为与径流具有相关性的预报因子;输出变量y为径流;fX;ω为具有一定结构特征的模型形式;ω为模型参数,通过历史样本训练得到;ε为分布函数为gθ的随机项;步骤2:根据步骤1中的备选模型集,依次选择每一个备选模型作为模型假设;已知样本容量为L的样本集DL为来自总体D中的抽样,采用已知样本DL构建模型y=fX;ω*+ε,ε~gθ*对总体D进行推断,ω*为用样本DL对总体D进行推断的模型参数,此时分布函数为gθ*,作为真实模型的总体估计,模型真实精度估计为σ*;将已知样本集DL划分为样本容量分别为n和m的训练集DL,n和测试集DL,m,记该样本集划分方案为Ln,m;将训练集DL,n用于模型参数率定,测试集DL,m用于模型预测精度的检验;记采用训练集DL,n率定的预报模型为ωDL,n为参数ω*的估计值;定义原假设H0和备择假设H1用于检验预报模型的真实性;其中:H0:模型y=fX;ω*+ε,ε~gθ*假设为真,采用训练集DL,n率定得到的预报模型为真实模型,其在测试集DL,m的预测精度σn,m等于模型真实精度σ*;H1:预报模型不为真,即预测精度σn,m不等于σ*;若预报模型为真,则σn,m在一定的许可偏差范围内逼近σ*,构造统计量:Z=σn,m-σ*;当σn,m使得统计量Z的观察值z0的绝对值过分大的情况发生时,拒绝假设H0,反之接受假设H0;步骤3:对步骤2中选择的一个模型假设,采用样本容量为L的实测样本DL0率定模型参数,作为真实模型的总体估计,模型真实精度估计为σ*;步骤4:采用蒙特卡洛法对总体的模型y=fX;ω*+ε,ε~gθ*进行样本容量为L的抽样,记抽样次数为C,C次样本容量均为L,对每一组划分方案Ln,m方案,采用C次抽样进行模型率定和检验,得到预测精度的抽样分布;步骤5:以平均距离最小为原则确定最佳样本集划分容量Lnr,mr,使得统计量Z的抽样分布尽可能逼近真实H0,若Z的抽样分布与模型真实精度的平均距离指标越小,代表统计量Z的抽样分布足够逼近真实H0,即最佳样本集划分容量Lnr,mr的预测精度σn,m的抽样分布与模型真实精度σ*逼近,原假设H0为真的概率越大;步骤6:根据步骤5中最佳样本集划分容量Lnr,mr的预测精度σn,m样本集构建统计量Z的抽样分布,根据统计量Z的抽样分布和给定显著性水平α确定统计量Z抽样分布的拒绝域;步骤7:基于实测样本构建样本集划分容量为Lnr,mr的预报模型,计算测试集的预测精度以及统计量Z的观察值z0;步骤8:根据统计量Z的观察值z0是否落在统计量Z抽样分布的拒绝域,判断是否拒绝原假设H0,若拒绝原假设H0,则当前模型未通过假设检验,不适合作为优选模型;在对每一个备选模型执行假设检验后,若存在多个备选模型均通过假设检验,进一步采用p值法给出原假设H0可被拒绝的最小显著性水平,p值的计算式为:p=P{|z|≥z0};认为对原假设H0拒绝率1-p最小的模型最接近真实模型,基于“拒绝率最小”准则进行模型优选。

全文数据:

权利要求:

百度查询: 长江勘测规划设计研究有限责任公司 一种基于假设检验的有限样本下数据驱动径流预报模型优选方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。