首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】采用机器学习建模来判别锆石宿主岩石和成矿环境的方法_中国地质大学(北京)_202310976568.6 

申请/专利权人:中国地质大学(北京)

申请日:2023-08-04

公开(公告)日:2024-06-14

公开(公告)号:CN117272181B

主分类号:G06F18/243

分类号:G06F18/243;G06F18/2415;G06F18/214;G06F18/211;G06N20/20;G06N7/01

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2024.01.09#实质审查的生效;2023.12.22#公开

摘要:本发明提供了一种采用机器学习建模来判别锆石宿主岩石和成矿环境的方法,采用大数据分析技术,采用机器学习方法建立锆石对宿主岩浆岩和矿床的判别模型,顺应了当下地质学界数字化发展的方向。此模型不再受限于传统二元图解,而是更多维度的参与,并且大大提高了分类准确度,可以高效可靠地指导物质来源调查及成矿环境评估。另一个模型的好处是,它在分类时使用的特征,是经过算法计算后的排名较前的重要特征,避免人为绘制二元图解时由于主观因素带来的干扰。为了便于一线地质工作者对模型的使用,在分类模型基础上开发了网页端,用户只需要上传锆石成分数据即可获得对宿主岩浆岩或矿床的预测结果。

主权项:1.一种采用机器学习建模来判别锆石宿主岩石和成矿环境的方法,其特征在于,具体包括以下步骤:S1锆石数据库的建设;收集的锆石元素包括Hf、U、Th、Y、Ti、Nb、Ta和REE;锆石数据库包括岩浆岩数据库和矿床数据库,岩浆岩数据库包含金伯利岩、碳酸岩、基性岩、中性岩、酸性岩和伟晶岩,矿床数据库包括斑岩型Cu-Mo-Au矿床、多金属矽卡岩型矿床、侵入岩有关Au矿床、Fe-Cu矽卡岩型矿床和Nb-Ta矿床;S2数据预处理;具体包括以下步骤:S21锆石数据库中元素数据的空缺值处理;锆石数据库的元素数据空缺值包括三类情况,其中第一类为元素含量低于检测线,导致数据缺失,此种情况建模时不考虑;第二类为元素数据的空缺值超过20%,在建模时不考虑;第三类为除第一类和第二类以外的空缺值,采用“knn-classification”算法进行填充,根据公式(1)和公式(2)距离来确定距离缺失数据最近的K个样本,然后用对这K个样本取平均值之后的结果填补缺失值;dxy=(1)weight=(2);S22数据标准化;数据标准化将不同特征的度量单位和量纲统一,消除数量级差异的影响,采用“Z-score”方法,将数据转换为均值为0,标准差为1的数据结构公式(3):x=(3)式中,μ是原始数据的均值,σ是原始数据的标准差;S23数据不平衡处理;采用“smote”方法:首先,计算小数据量类别中的每个数据与相邻k个数据的距离;然后从k个最近邻中随机选择若干个数据,生成一个新的合成数据;将新的合成数据添加到原数据集中,形成新的数据集,增加小数据量类别的数据量;S3分类模型建构和选取;具体包括以下步骤:S31将数据分为训练集和测试集,设定9:1的训练集:测试集比例;S32采用随机森林算法去拟合收集的数据,按照bagging算法从样本集中随机且有放回地抽取含有M个数据的样本集;在进行N轮抽取之后,得到N个决策树;对于一个输入样本,N棵决策树会产生N个分类结果;随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出;公式(4)是多数表决表达式, (4)式中,Hx表示组合分类模型,hi是单个决策树分类模型Y表示输出变量,I∙为示性函数;S33通过贝叶斯优化算法自动地调整模型的参数;通过先验概率和后验概率计算出每个参数组合的期望目标值,并在每次迭代中通过代理模型选择最有可能提高目标函数的参数组合;S34采用5折交叉验证法去验证分类模型的可靠性;把数据平均分成5等份,每次实验拿一份做测试,其余用做训练;记录5次实验的结果,并求它们的平均值,得到锆石微量元素的随机森林模型对岩浆岩和矿床分类的效果,F1分数分别为0.963和0.961;S4模型简化;具体包括以下步骤:S41对于岩浆岩和矿床分类的模型,采用特征重要性置换筛选模型中的重要特征,岩浆岩分类模型中Hf为最重要,Sm为最不重要;矿床分类模型中,Y为最重要,其次是Eu、Hf、U,Gd为最不重要;S42首先选择最重要的前2个元素,然后依次递加,直到第8个元素,岩浆岩分类模型F1分数从初始的前2个元素的0.612增加到前8个元素的0.902,矿床分类模型F1分数从初始的前2个元素的0.478增加到前8个元素的0.851;采用贝叶斯参数优化,得到8个锆石元素的岩浆岩和矿床分类模型的F1分数分别为0.919和0.891;S5网站开发;基于包含8个最重要元素的岩浆岩和矿床分类模型开发网页前端。

全文数据:

权利要求:

百度查询: 中国地质大学(北京) 采用机器学习建模来判别锆石宿主岩石和成矿环境的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。