买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南通理工学院
摘要:本发明涉及数据处理技术领域,具体涉及基于多源数据融合的二氧化碳地质封存评价方法及系统,包括:获取地质数据样本集;根据地质数据样本集中每个维度的初始抽样权重以及地质数据样本集的每个维度在每个决策树中对应的每个节点在分裂过程中随机抽样的重要特征,得到地质数据样本集的每个维度在每个决策树中对应的每次随机抽样过程中的抽样权重;根据地质数据样本集的每个维度在每个决策树中对应的每次随机抽样过程中的抽样权重,使用随机森林模型对地质数据样本集进行运算,得到每个地区的二氧化碳地质封存评价结果。本发明保证决策树多样性,提高了二氧化碳地质封存评价结果准确性。
主权项:1.基于多源数据融合的二氧化碳地质封存评价方法,其特征在于,该方法包括以下步骤:获取地质数据样本集;所述地质数据样本集中包含若干个不同的地区对应的样本向量,所有地区被划分为若干个可封存地区和不可封存地区;根据所有地区对应的样本向量中每个数据,构成地质数据样本集的每个维度;根据地质数据样本集中不同维度之间的差异以及同一维度中的数据差异,得到地质数据样本集中每个维度的初始抽样权重;获取地质数据样本集对应的若干个决策树;根据每个决策树,得到地质数据样本集的每个维度在每个决策树中对应的每个节点的纯度;根据地质数据样本集的每个维度在每个决策树中对应的每个节点的纯度之间的差异,得到地质数据样本集的每个维度在每个决策树中对应的每个节点对应的两个子节点的纯度变化程度;根据地质数据样本集的每个维度在每个决策树中对应的每个节点对应的两个子节点的纯度变化程度以及每个决策树,得到地质数据样本集的每个维度在每个决策树中对应的每个节点在分裂过程中随机抽样的重要特征;根据地质数据样本集中每个维度的初始抽样权重以及地质数据样本集的每个维度在每个决策树中对应的每个节点在分裂过程中随机抽样的重要特征,得到地质数据样本集的每个维度在每个决策树中对应的每次随机抽样过程中的抽样权重;根据地质数据样本集的每个维度在每个决策树中对应的每次随机抽样过程中的抽样权重,使用随机森林模型对地质数据样本集进行运算,得到每个地区的二氧化碳地质封存评价结果;所述根据地质数据样本集中不同维度之间的差异以及同一维度中的数据差异,得到地质数据样本集中每个维度的初始抽样权重,包括的具体公式如下: 式中,表示地质数据样本集的第个维度的初始抽样权重;表示地质数据样本集的第个维度中所有可封存地区对应的样本向量中数据的方差;表示地质数据样本集的第个维度中所有不可封存地区对应的样本向量中数据的方差;为线性归一化函数;表示地质数据样本集第个维度与地质数据样本集第个维度的皮尔逊相关系数;表示地质数据样本集的维度数量;为绝对值函数;所述根据每个决策树,得到地质数据样本集的每个维度在每个决策树中对应的每个节点的纯度,包括的具体步骤如下:所述每个决策树对应若干次随机抽样过程,每次随机抽样过程对应地质数据样本集的一个维度,每个决策树中包含若干个节点,每个节点对应地质数据样本集的一个维度,每个节点对应若干个样本向量,每个节点对应两个子节点,所述子节点是从所有节点中筛选出的;根据地质数据样本集第个维度在第个决策树中对应的第个节点对应的所有样本向量对应的地区中的可封存地区的数量以及不可封存地区的数量,得到地质数据样本集的第个维度在第个决策树中对应的第个节点的纯度;所述地质数据样本集的第个维度在第个决策树中对应的第个节点的纯度的具体计算公式如下: 式中,表示地质数据样本集的第个维度在第个决策树中对应的第个节点的纯度;表示地质数据样本集第个维度在第个决策树中对应的第个节点对应的所有样本向量对应的地区中的可封存地区的数量;表示地质数据样本集的第个维度在第个决策树中对应的第个节点对应的所有样本向量对应的地区中的不可封存地区的数量;表示地质数据样本集的第个维度在第个决策树中对应的第个节点中所有样向量数量;所述根据地质数据样本集的每个维度在每个决策树中对应的每个节点的纯度之间的差异,得到地质数据样本集的每个维度在每个决策树中对应的每个节点对应的两个子节点的纯度变化程度,包括的具体公式如下: 式中,表示地质数据样本集的第个维度在第个决策树中对应的第个节点对应的两个子节点的纯度变化程度;表示地质数据样本集的第个维度在第个决策树中对应的第个节点的纯度;表示地质数据样本集的第个维度在第个决策树中对应的第个节点对应的第个子节点的纯度;为线性归一化函数;所述根据地质数据样本集的每个维度在每个决策树中对应的每个节点对应的两个子节点的纯度变化程度以及每个决策树,得到地质数据样本集的每个维度在每个决策树中对应的每个节点在分裂过程中随机抽样的重要特征,包括的具体计算方法如下:将、以及的乘积,记为地质数据样本集的第个维度在第个决策树中对应的第个节点在分裂过程中随机抽样的重要特征;其中表示地质数据样本集的第个维度在第个决策树中对应的第个节点对应的两个子节点的纯度变化程度;表示地质数据样本集的第个维度在第个决策树中对应的第个节点对应的第个节点对应的所有样本向量与和第个子节点对应的所有样本向量之间的全链接结果值;表示地质数据样本集的第个维度在第个决策树中对应的第个节点对应的子节点对应的所有样本向量对应的地区中可封存地区的数量与不可封存地区的数量的差值的特征值。
全文数据:
权利要求:
百度查询: 南通理工学院 基于多源数据融合的二氧化碳地质封存评价方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。