首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于自然近邻类的机械监测标签数据质量保障方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:燕山大学

摘要:本发明涉及大数据处理与机械故障诊断技术领域,尤其是一种基于自然近邻类的机械监测标签数据质量保障方法,基于非参数算法构造的自然近邻图,建立标签数据不同样本之间的关系,通过这种关系,搜索不同的类;计算类局部离群因子来评估不同类的异常程度,将CLOF大于预定阈值的类检测为低质量数据,对清洗后的标签数据进行自然近邻图重构,基于该自然近邻图,检测错误标记的数据,并识别未标记数据的标签,还可用于查找带有新类型的标签数据;本发明能够有效地检测不同标签数据中的低质量数据,使标签数据可以基于自然近邻自动识别和标记,进一步提高了标签数据的质量,有助于智能故障诊断建模和机械监测数据质量的提高。

主权项:1.一种基于自然近邻类的机械监测标签数据质量保障方法,其特征在于,包括步骤如下:S1:提取机械各标签数据的时域特征、频域统计特征,构建具有特征属性的数据对象集:P{p1,p2,···pN};S2:基于自然近邻思想,对于构建的数据对象集,通过搜索自然近邻信息构建互访问路径,形成近邻图,具体包括以下子步骤:S21:设置初始化参数,使数据对象集内任意对象pi对应的自然邻居状态NBpi为0;任意对象pi的k邻居集Nkpi为空集;任意对象pi的互k近邻集MNkpi为空集;S22:搜索k=1时,pi的k近邻并存入Nkpi,再搜索Nkpi中对象pi的k近邻,若pi属于集合Nkpi,说明二者互为近邻,此时pi的自然邻居状态NBpi=1;S23:将S22步骤的搜索过程看作一次迭代,将迭代停止条件设定为迭代前后两次拥有互近邻数增加值是否小于k,如小于k则停止迭代;如不小于k,则令k自增1后再次带入S22步骤进行迭代;S24:当搜索停止时,数据对象集达到自然稳定状态,得到的k值即为自然特征值R,基于自然近邻关系构建出自然近邻图;S3:根据步骤S2构建起的自然近邻图,通过自然近邻关系查询自然近邻类,确定同类对象,具体包括以下子步骤:S31:通过查询V中顶点的自然近邻数,从大到小排序,查找出近邻数最多的顶点并将其记作为v;S32:基于类的定义对步骤S31中指定的顶点进行查询,将v与v的自然近邻点NRv归为第一类,即c1,此时c1内除了v的点都与v存在边直接相连;S33:自然近邻图的形成还包括间接连接的可达路径,所以进一步迭代查询c1内点的自然近邻点即NRc1,直至迭代第m次与m-1次的c1元素个数之差为0为止,表示与v共自然近邻图域的顶点均已被搜索到;S34:将c1元素从顶点集合V中全部去除,重复S31,S32,S33的查询过程,直至V变为空集为止;S35:将构建的类集按照类数目由大到小重新排序,可获得新的数据类集:C={c1,c2,···,cn}且|c1|≥|c2|≥···|cn|;S4:为了描述不同类的质量高低,基于自然近邻类,在传统局部异常因子方法的基础上构建一种新的类局部异常因子算法,构建流程如下:S41:对于数据类集C={c1,c2,···,cn}且|c1|≥|c2|≥···|cn|,从中选出高质量类,记为Ch={c1,c2,···,cl},其他类称为可疑类,记为Csus={cl+1,cl+2,···,cn};S42:计算高质量类内各个对象的局部异常因子值CLOF;S43:通过计算类间距离评估可疑类与高质量类相似程度;S44:借助可疑类与高质量类相似程度及已获得的高质量点异常程度,计算可疑类局部异常因子值CLOF′cl+q,以此评估可疑类内点的异常程度;S45:引入角度异常检测,进一步修正可疑类局部异常因子,防止部分正常数据误检测为异常,算得对象pw的角度离群系数ABOFpw,pw∈D,求得修正后cl+q的类局部异常因子CLOFxl+q;S5:对低质量数据检测和未知标签进行识别,具体包括以下步骤:S51:低质量数据的检测;由步骤S4获得的类局部异常因子包括高质量类和可疑类的CLOF,低质量数据的确定通过设定阈值λ进一步判断,若可疑类CLOF超过λ,则判定该类数据质量较低,否则说明该类数据属于高质量数据,从而将检测出的低质量数据剔除,提高标签数据准确性;S52:由步骤S51针对低质量剔除后的标签数据,再次重构自然近邻图,该环节自然近邻搜索停止条件设定为前后两次互近邻对象不再增加为止;S53:根据所形成的的自然近邻图,获得各高质量类,并判断监测数据的具体标签种类,有以下三种结果:1若pi数据对象代表的故障标签为而pi∈cj,则类cj内所有数据对象的故障标签为2若类cj内不存在已知标签数据对象,且类cj属于可疑类,则类cj与离其最近的高质量类故障标签类别相同;3若以上两种结果都不发生,则判定类cj内所有数据对象的故障标签为新故障类别。

全文数据:

权利要求:

百度查询: 燕山大学 一种基于自然近邻类的机械监测标签数据质量保障方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。