买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:东海实验室
摘要:本发明公开了一种不定长时间序列数据相似性查询方法,包括数据包络块构建、数据索引构建、查询处理三个步骤。首先,利用分段表示方法抽取不等长子序列的局部特征,并计算子段特征上下边界;然后,针对包络块数据构建符号聚集近似索引结构;最后,基于下界距离快速过滤候选集,实现近似查询和精确查询。本发明提出的数据包络技术可有效支持时间序列数据规范化,针对任意长的查询需求可实现统一高效的查询处理,本发明降低了数据存储的空间复杂度,保证了查询结果的相似性,显著提升了查询效率,且具有较高的稳健性,在大数据和数据挖掘、人工智能、数据库等领域可发挥重要作用。
主权项:1.一种不定长时间序列数据相似性查询方法,其特征在于包括如下步骤:(1)数据包络块构建;在查询长度范围内切分时间序列数据,对得到的不等长子序列数据进行分段聚集近似表示,获取各子序列对应子段的特征值,并基于特征值构建包络块;(2)数据索引构建;获取每个包络块边界的符号表示,对所有包络块构建基于符号表示的时间序列索引;计算每个包络块边界的二进制符号表示,对所有包络块构建iSAX索引,包括以下子步骤:(2.1)基于高斯概率分布,将实数区间划分为等概率的若干子区间,并对每个子区间以连续二进制数进行编码,根据包络块上下边界数值所在区间,将其表示为二进制编码形式,包络块上下边界数值为包络块内特征值的最大值和最小值;(2.2)根据每条子序列包络块的上下边界二进制编码,分别将其插入上界iSAX索引树和下界iSAX索引树,根据每个子段二进制编码从后到前的顺序,依次分裂子节点,直至叶节点;(3)查询处理;对查询序列进行分段符号近似表示,依次计算其到时间序列索引中每个节点的下界距离,将下界距离最小的一组节点包含的数据作为近似查询结果。
全文数据:
权利要求:
百度查询: 东海实验室 一种不定长时间序列数据相似性查询方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。