首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于随机森林算法的地震信号识别方法、装置及设备_山东省地质科学研究院_202410391433.8 

申请/专利权人:山东省地质科学研究院

申请日:2024-04-02

公开(公告)日:2024-06-14

公开(公告)号:CN117970428B

主分类号:G01V1/01

分类号:G01V1/01;G01V1/30;G01V1/38

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2024.05.21#实质审查的生效;2024.05.03#公开

摘要:本发明提供了基于随机森林算法的地震信号识别方法、装置及设备,所述方法包括:获取地震数据;使用短时平均长时平均方法对所述地震数据进行处理,提取地震事件;对所述地震事件进行特征提取,获取每一地震事件的提取特征,对所述提取特征进行标记,为每一特征制定一个类别标签,得到数据集和特征集;利用所述数据集和特征集构建随机森林分类器,利用所述随机森林分类器对地震信号、海底地震事件和噪音进行分类。本申请通过随机森林算法综合多个决策树的结果,能够有效地处理多维特征空间和复杂的分类任务,具有较高的分类准确性和鲁棒性,可以实现对不同类型信号的自动识别和分类,为海洋地震学数据的事件识别提供了一种有效的方法。

主权项:1.一种基于随机森林算法的地震信号识别方法,其特征在于,所述方法包括:获取地震数据;使用短时平均长时平均方法对所述地震数据进行处理,提取地震事件;对所述地震事件进行特征提取,获取每一地震事件的提取特征,对所述提取特征进行标记,为每一特征制定一个类别标签,得到数据集和特征集;利用所述数据集和特征集构建随机森林分类器,利用所述随机森林分类器对地震信号、海底地震事件和噪音进行分类;其中,所述利用所述数据集和特征集构建随机森林分类器,利用所述随机森林分类器对地震信号、海底地震事件和噪音进行分类,包括:S4.1,将所述数据集分为训练集和测试集;S4.2,利用Bootstrap方法对所述训练集进行有放回的采样,随机产生T个第一子训练集;S4.3,对应于每个所述第一子训练集,从所述特征集的M个特征中随机抽取m个特征,m<M,得到T个第一子特征集;S4.4,T个第一子训练集与T个第一子特征集一一对应生成T个决策树,形成第一随机森林;S4.5,根据所述测试集,对所述第一随机森林进行测试,得到第一随机森林每个决策树的输出结果;S4.6,计算每个决策树的输出结果的决策误差εi,i=1,2,…,T;S4.7,对每个决策树的输出结果对应的第一子特征集赋予权重系数ωi,i=1,2,…,T,第一子特征集权重系数ωi的计算公式为: S4.8,计算所述特征集中每个特征的权重总数Ωk,并将所述特征集中的所有特征按照权重总数Ωk从大到小的顺序进行排序,得到排序后的特征集;所述权重总数Ωk的计算公式如下: 其中,Ωki表示第k个特征在第i个第一子特征集中的权重系数;k表示特征在特征集中的序号,k=1,2,…,M;i表示第一子特征集的序号,i=1,2,…,T;Ωki的取值如下: S4.9,将所述排序后的特征集中的特征按照5:5的比例分为高区分度特征区间和区分度不明显特征区间;S4.10,利用Bootstrap方法对所述训练集重新进行有放回的采样,随机产生T个第二子训练集;S4.11,对于每个所述第二子训练集,从所述特征集的高区分度特征区间中随机抽取s个特征,从所述特征集的区分度不明显特征区间中随机抽取m-s个特征,m<M,产生T个第二子特征集;S4.12,所述T个第二子训练集与T个第二子特征集一一对应生成T个决策树,形成第二随机森林;S4.13,根据所述测试集,对所述第二随机森林进行测试,得到第二随机森林每个决策树的输出结果,并投票检测第二随机森林的精度;S4.14,计算第二随机森林中每两个决策树之间的决策相似度τij,决策相似度τij的计算公式如下: 其中,a为第i个决策树和第j个决策树都分类正确的测试数据个数,b为第i个决策树分类正确、第j个决策树分类错误的测试数据个数,c为第i个决策树分类错误、第j个决策树分类正确的测试数据个数,d为第i个决策树和第j个决策树都分类错误的测试数据个数,i≠j;S4.15,选择决策相似度τij最接近1的两个决策树,分别计算两个决策树的决策误差,将决策误差小的决策树删除,得到决策树删除后随机森林;若两个决策树的决策误差相同,则随机删除一个决策树,得到决策树删除后随机森林;S4.16,根据所述测试集,对决策树删除后随机森林进行测试,得到决策树删除后随机森林中每个决策树的输出结果,并投票检测决策树删除后随机森林的精度;S4.17,若决策树删除后随机森林的精度大于第二随机森林的精度,则重复步骤S4.15-S4.16,直至决策树删除后随机森林的精度小于决策树删除前随机森林的精度,停止循环,以决策树删除前随机森林为随机森林分类器;若决策树删除后随机森林的精度小于第二随机森林的精度,则以第二随机森林为随机森林分类器;S4.18,利用所述随机森林分类器对地震信号、海底地震事件和噪音进行分类。

全文数据:

权利要求:

百度查询: 山东省地质科学研究院 基于随机森林算法的地震信号识别方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。