买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:河海大学
摘要:本发明公开了一种耦合Boruta算法与相关性分析的指标筛选方法,包括S1、根据已有数据进行预处理,生成包含因变量和多个待筛选自变量的数据集;S2、对自变量数据集中的n个指标进行Boruta重要性排序,删除不重要指标;S3、对余下的指标进行相关性分析,设定多个相关系数的阈值r;S4、针对每一个相关系数的阈值r,从最重要的指标开始,删除与其相关系数大于选定阈值的所有其他指标;选择未被删除的第二重要指标,重复该步骤依次筛选,直至完成最后一个指标的筛选,删选出的指标构成该阈值r对应的指标集;S5、采用每一个阈值对应遴选出的指标集作为参数建立模型;S6、根据模型精度选择最终的指标集。该方法具有遴选重要指标和避免多重共线性问题的优点。
主权项:1.一种耦合Boruta算法与相关性分析的指标遴选方法,其特征在于,包括如下步骤:步骤S1、根据待研究目标已有的数据进行预处理,生成包含因变量y和多个待筛选自变量xx1,x2…xn的数据集;步骤S2、对自变量数据集x中的n个指标进行Boruta重要性排序,删除根据Boruta算法得出的不重要的指标;步骤S3、对余下的指标进行相关性分析,并设定多个相关系数的阈值r;步骤S4、针对每一个相关系数的阈值r,从最重要的指标开始,删除与其相关系数大于选定阈值的所有其他指标;然后选择未被删除的第二重要指标,根据阈值继续删除其他指标;依次筛选,直至完成最后一个指标的筛选,删选出的指标构成该阈值r对应的指标集;步骤S5、重复步骤S4,每一个阈值对应生成一个指标集;将所有指标集归纳为指标库;步骤S6、采用每一个阈值对应遴选出的指标集作为参数建立模型;步骤S7、利用步骤S1中采集的数据对模型进行训练,并根据模型精度选择最终的指标集。
全文数据:
权利要求:
百度查询: 河海大学 一种耦合Boruta算法与相关性分析的指标遴选方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。