买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州明讯软件技术有限公司
摘要:本发明涉及数据分析技术领域,尤其涉及IT运维管理方法及IT运维管理装置,包括通过对历史数据的数据提取、归类整理与计算分析,为后续深入分析提供方向;通过数据处理分析和特征值提取,反映数据中心的运行状态和潜在风险,便于后续的建模分析;通过构建风险预测模型,便于实施风险预警和应急响应措施;通过划分监测周期,并实时监测数据中心的运行数据,确保数据的时效性和完整性;通过风险评分预测与阈值设定,提高运维效率,从而减少故障发生。本发明用于解决现有方案中IT运维管理中全面监控和智能管理不足的技术问题。
主权项:1.IT运维管理方法,其特征在于:步骤一、从数据库中提取数据中心的历史数据,并进行归类整理和计算分析,从而获取正常数据组和故障数据组;针对正常数据组和故障数据组进行溯源得到第一数据组和第二数据组;步骤二、基于第一数据组和第二数据组进行处理分析,分别得到第一数据组和第二数据组的特征值;步骤三、根据第一数据组和第二数据组的特征值进行建模分析,构建风险预测模型;步骤四、划分监测周期进行实时监测,定期采集数据中心机房的运行数据;步骤五、获取监控平台的原始数据,预处理后输入风险预测模型中,进行风险评分预测,并设定阈值区分风险情况;其中所述步骤一,从数据库中提取数据中心的历史数据,并进行归类整理和计算分析,从而获取正常数据组和故障数据组;针对正常数据组和故障数据组进行溯源得到第一数据组和第二数据组的过程包括:在提取数据中心的历史数据时,确定关键信息;其中,关键信息包括设备性能状态数据、物理环境状态数据以及时间戳信息;将设备性能状态数据归类为衡量设备性能状态的直接指标,物理环境状态数据归类为反映数据中心物理环境状态的辅助指标;其中,直接指标和辅助指标均附带一个时间戳信息作为对数据中心的历史数据进行排序和溯源的标签指标;对直接指标和辅助指标进行计算分析时,利用公式计算加权均值参数: ,其中,式中,表示第i个关键信息数据点的值;表示第i个关键信息数据点的权重;i表示键信息数据点的编号;s表示键信息数据点的总数;表示介于0和1之间的调节因子;IF表示指标的重要性因子;HP表示基于历史数据的性能因子;利用公式计算加权标准差参数: ;基于加权均值参数和加权标准差参数,确定每个指标的正常数据组和故障数据组: 式中,WNLB表示加权正态分布下限值,WNUB表示加权正态分布上限值;若指标的值低于指标正常操作范围的下限或高于指标正常操作范围的上限,则视为异常;若指标的值属于指标正常操作范围内,则视为正常;h表示预先选定的倍数,用于确定正常数据组和故障数据组的边界;结合标签指标对每个指标的正常数据组和故障数据组进行溯源,并将溯源后的正常数据组和故障数据组分别标记为第一数据组和第二数据组;其中所述步骤二,对第一数据组进行处理分析,得到第一数据组的特征值的过程包括:基于第一数据组引入n×m的矩阵X;其中,矩阵X是一个二维矩阵;每一列代表一个变量,即第一数据组的直接指标和辅助指标的量化指标,m表示量化指标的数量;每一行代表一个观测值,即变量的样本数据点数值,n表示观测值的数量;则有协方差矩阵:式中,表示协方差矩阵;T表示矩阵的转置;N表示观测值的总数;解特征方程,得到和v;式中,是数学中的一个符号,代表行列式的确定根,用于表示矩阵行列式的值;表示第一数据组的特征值;v表示特征向量;表示单位矩阵;将所有特征值进行降序排列,保留最大的k个特征值;选取最大的k个特征值对应的特征向量,构造变换矩阵;其中,k表示最大特征值的数量;使用变换矩阵A将数据映射到新的坐标系,得到新的数据矩阵;其中,;新的数据矩阵的列,即为第一数据组的特征值,代表数据中的主要变化模式,提取第一数据组的特征值;式中,p表示第一数据组特征值的数量;其中所述步骤二,对第二数据组进行处理分析,得到第二数据组的特征值的过程包括:从第二数据组中提取直接指标和辅助指标的数值;结合标签指标设置约束条件: 式中,U1、U2表示加权处理后的直接指标和辅助指标值;表示时间窗口内U1、U2的平均值;t表示当前时间点,即计算时间窗口内U1、U2的平均值结束的时间点;L表示时间窗口的长度;表示U1、U2作为时间的函数;为积分变量,表示在时间窗口[t-L,t]内的任意时间点;为积分的无穷小增量,表示的微小变化;表示在[t-L,t]内对进行积分的表达式;表示积分结果的归一化因子;表示的预设平均阈值,用于判断数据中心是否处于故障状态;表示故障特征值;将故障特征值转换为数值型故障特征值: 式中,为第二数据组的数值型故障特征值,表示第二数据组的数值超出其平均阈值的程度;表示选取的最大值函数,用于使故障特征值始终为非负;其中所述步骤三,根据第一数据组和第二数据组的特征值进行建模分析,构建风险预测模型的过程包括:获取两组数据组的数据集,其中,表示第一数据组的数据集,表示第二数据组的数据集;利用信息增益比作为预测数据中心机房风险水平的标准,其中,具体分析公式如下: 式中,为条件熵,表示在特征值b已知的情况下,数据集的不确定性;表示特征值b的取值j分割得到的数据子集大小;表示数据集的大小;表示信息增益;表示信息增益比;统计所有信息增益比,并进行降序排列;选择信息增益比靠前的特征作为分裂属性,并视为逻辑回归模型的输入特征;其中,将选定的特征用于训练集和验证集的数据准备;结合信息增益比的分析结果筛选出的输入特征,训练逻辑回归模型;其中,训练过程如下:定义损失函数,并利用梯度下降公式更新逻辑回归模型参数: 式中,表示损失函数结果值;β表示逻辑回归模型参数向量,包含所有权重;M表示输入特征的总数;q表示输入特征的编号;β0表示逻辑回归模型参数中的截距部分,不依赖于任何特征的常数值,即特征值全部为1时的预测值;表示第q个输入特征值;表示步长,用于控制每次迭代更新步长的大小,决定下降的速度;表示第q个输入特征值对应的目标值;将训练后的多个特征集合,进行预测结果的数量统计;重复E次,最后取平均预测结果值进行整合,形成一个综合的数据中心机房的风险预测模型。
全文数据:
权利要求:
百度查询: 杭州明讯软件技术有限公司 IT运维管理方法及IT运维管理装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。