买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国电力科学研究院有限公司;国家电网有限公司
摘要:本发明涉及一种基于关联算法的继电保护数据的完整性校核方法及系统,包括:根据获取的历史记录确定项目集合,并构建事务集;基于不同的属性信息,利用项目集合和事务集分别挖掘频繁项目集;根据频繁项目集中的多项频繁项目集确定关联规则,建立关联规则库;获取当前的继电保护数据,并根据预设的不完整记录确定策略确定不完整记录;按照确定的不完整记录的确定属性的属性值搜索所述关联规则库,以确定与所述不完整记录匹配的关联规则,并利用所述与不完整记录匹配的关联规则确定所述不完整记录的不确定属性的实际值。本发明使用推断值代替预置值,使得校验后的数据更符合大数据的关联关系,能够为基于继电保护大数据的研究提供数据支撑。
主权项:1.一种基于关联算法的继电保护数据的完整性校核方法,其特征在于,所述方法包括:根据获取的历史记录中不同属性的属性值集合确定项目集合,并利用获取的历史记录构建事务集;基于不同的属性信息,利用所述项目集合和事务集分别挖掘频繁项目集;根据频繁项目集中的多项频繁项目集确定关联规则,并建立关联规则库;获取当前的继电保护数据,并根据预设的不完整记录确定策略确定不完整记录;按照确定的不完整记录的确定属性的属性值搜索所述关联规则库,以确定与所述不完整记录匹配的关联规则,并利用与不完整记录匹配的关联规则确定所述不完整记录的不确定属性的实际值;其中,所述基于不同的属性信息,利用所述项目集合和事务集分别挖掘频繁项目集,包括:步骤21,将所述项目集合中每个项目的支持度与预设的支持度阈值进行比较,筛选支持度大于等于预设的支持度阈值的项目保留,以获取1项频繁项目集;步骤22,设置k=2;步骤23,在k-1项频繁项目集中,确定任意两个最后一个元素不同的项目集的并集,并判断每个并集的所有子集是否都在k-1项频繁项目集;步骤24,若某个并集的所有子集都在k-1项频繁项目集中,则计算该并集的支持度,并筛选支持度大于等于预设的支持度阈值的项目集保留,以获取k项频繁项目集;步骤25,判断k-1项频繁项目集的项目数是否大于等于2;若是,则更新k=k+1,并返回步骤23;反之,则结束;其中,所述根据频繁项目集中的多项频繁项目集确定关联规则,并建立关联规则库,包括:对于任一个多项频繁项目集,根据该多项频繁项目集中的元素确定多个对应的前项和后项,以分别确定多个初始关联规则;筛选所述多个初始关联规则的中置信度大于等于预设置信度阈值的初始关联规则为强关联规则,并利用所述强关联规则建立关联规则库;其中,所述筛选所述多个初始关联规则中置信度大于等于预设置信度阈值的初始关联规则,包括:步骤31,选取一个多项频繁项目集;步骤32,设置g=2;步骤33,从该多项频繁项目集中筛选1-后件的初始关联规则,将各初始关联规则的置信度分别与置信度阈值比较,将置信度大于等于置信度阈值的初始关联规则确定为强关联规则;步骤34,将该多项频繁项目集中的g-1-后件强关联规则的后件构成g-1-后件集合,将g-1-后件集合中仅有1个元素不同的2个后件取并集,并判断该并集包含的所有项目是否都在g-1-后件集合中;步骤35,若某个并集包含的所有项目都在g-1-后件集合中,则以该并集作为后件构成本多项频繁项目集的一项关联规则,判断该关联规则的置信度是否大于等于置信度阈值,若是,则将该关联规则确定为强关联规则;步骤36,判断当前的g是否小于本频繁项目集中项目数与1的差值;其中,若是,则更新g=g+1,并返回步骤34;反之,则结束。
全文数据:
权利要求:
百度查询: 中国电力科学研究院有限公司 国家电网有限公司 基于关联算法的继电保护数据的完整性校核方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。