买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:福建雄溪技术有限公司
摘要:本发明涉及数据采集分析技术领域,具体为基于多算法交互的数据采集方法及其系统,本发明中,利用多个传感器收集数据,作为传感器节点数据;其中传感器收集过程包括数据采集频率和数据传输频率;利用随机森林算法模型对传感器节点数据进行异常分析,生成当前分析结果;其中:若当前分析结果为异常时,进行数据采集频率的调整,并再次进行异常分析,若当前分析结果为异常时,则将异常结果发送给管理人员;若当前分析结果为正常时,则利用时间序列分析算法对传感器节点数据进行分析,得出时间序列结果,并根据长短期记忆网络算法对所述时间序列结果进行综合分析;根据综合分析的结果,进行数据传输频率的调整,以及增加该传感器节点数据的权重。
主权项:1.基于多算法交互的数据采集方法,其特征在于,包括如下方法步骤:S1、利用多个传感器收集数据,作为传感器节点数据;其中传感器收集过程包括数据采集频率和数据传输频率;S2、利用随机森林算法模型对所述传感器节点数据进行异常分析,生成当前分析结果;其中:若当前分析结果为异常时,根据异常结果对S1进行反馈,通过对异常结果中对应的传感器节点数据,进行数据采集频率的调整,并再次进行S2,若当前分析结果为异常时,则将异常结果发送给管理人员;若当前分析结果为正常时,将执行S3;S3、利用时间序列分析算法对所述传感器节点数据进行分析,得出时间序列结果,并根据长短期记忆网络算法对所述时间序列结果进行综合分析;其中:若综合分析结果为异常时,根据综合分析结果的异常对S1进行反馈,通过对综合分析结果中对应的传感器节点数据,进行数据传输频率的调整,以及增加该传感器节点数据的权重;若综合分析结果为正常时,则完成数据采集以及异常分析;所述随机森林算法模型训练步骤如下:样本选择:从训练数据集中通过自助法随机抽取个样本,生成多个子样本集;特征选择:对每个决策树的节点,从所有特征中随机选择个特征,其中,从中选出最佳特征用于分裂,其中为所有特征的数量;对每个子样本集,构建一棵决策树,具体步骤如下:分裂节点:通过基尼系数作为分裂条件,从随机选择的个特征中找到最佳分裂特征,基尼系数公式为:,其中表示第类样本在训练数据集中的频率,表示训练数据集中类别的总数;递归构建:依据最佳特征分割数据集,递归地对分割后的子数据集进行上述分裂,直到满足停止条件,停止条件包括但不限于达到树的最大深度;模型融合:通过集成的方式将所有训练好的决策树组合在一起,对于输入的特征向量,每棵决策树独立地对其进行分类,输出类别;使用多数投票法来确定输入数据的最终预测类别,公式为:,其中为决策树的总数量,代表多数投票;所述随机森林算法模型根据传感器节点数据进行异常分析的步骤如下:将当前时刻传感器节点数据输入到训练好的随机森林模型中;随机森林模型输出对应的分类结果;其中:若时,表示当前分析结果为异常,并标记对应的异常数据点反馈给S1,根据异常数据点选择对应的传感器节点,调整S1中对应的传感器节点的数据采集频率,通过将采集间隔减小,增加采集频率,再次进行S2的异常分析,若此时的当前分析结果仍为异常时,则将异常结果发送给管理人员;若时,表示当前分析结果为正常,将执行S3;所述利用时间序列分析算法对传感器节点数据进行分析,得出时间序列结果,具体包括:提取时间序列中的季节性成分、趋势成分、和残差;其中:季节性成分的计算如下:通过移动窗口平滑对数据进行平滑处理;在每个周期内,对每个时间点进行局部多项式拟合;滑动窗口左移一个时间步,再次进行局部平滑,直到遍历整个时间序列;趋势成分的计算如下:从原始时间序列数据中减去季节性成分以得到去季节性数据;通过移动平均对去季节性数据平滑处理,以得到趋势成分;构建一个大于季节性窗口的滑动窗口;对时间序列数据进行局部多项式拟合,得到平滑后的趋势成分;残差的计算如下:从原始时间序列中减去提取出的趋势成分和季节性成分;最后,时间序列结果的计算为:。
全文数据:
权利要求:
百度查询: 福建雄溪技术有限公司 基于多算法交互的数据采集方法及其系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。