买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江大学
摘要:本发明公开了一种基于草图的流量高峰周期检测方法及平台,用于检测网络数据面中的流量高峰周期。本发明使用草图结构记录不同时间点流量的频率,并根据频率高峰的出现规律判断是否存在周期性,并计算周期。本方案可以部署在包括OVS‑DPDK等各网络转发平台,以低存储开销和计算开销完成高精度的流量高峰周期检测。相对已有的流量周期性特征检测算法,本方案重点关注流量高峰的周期检测,本方案可以完全部署在网络数据面,实现高精度实时检测,直接得到存在高峰周期的流量的键值和高峰周期。
主权项:1.一种基于草图的流量高峰周期检测方法,其特征在于,包括以下步骤:S1:设置时间窗长度,根据数据包到达时间,计算数据包所属的时间窗序号作为时间窗序列信息;构建草图结构,所述草图结构为一张由d个长度相同的哈希表组成的表格,d个哈希表对应的哈希函数各自独立,每个哈希表具有1行w列存储空间,每个存储空间包含两部分,分别存储时间窗序列信息和流量频率信息;根据数据包所属流量的键值信息,找到其在草图中的位置即d个哈希表的具体列作为目标位置,更新目标位置的信息,具体为:将数据包所属流量的键值信息分别输入d个哈希函数,每个哈希函数的输出结果作为其列位置索引;当有新数据包到达时,找到d个目标位置存储空间,若该d个存储空间记录的时间窗序列均与当前时间窗序列相同,对应存储空间中记录的流量频率加1;若找到的d个目标位置存储空间中,存在记录的时间窗序列小于当前时间窗序列的存储空间,则每个找到的存储空间中的流量频率均减去d个存储空间中流量频率的最小值s,并输出流量频率s及其对应的时间窗序列T;S2:构建新的哈希表Hnew,其具有4行u列存储空间,第一行中每个存储空间存储键值信息,第二行中每个存储空间包含两部分,分别存储时间窗序列信息和流量频率信息;使用哈希表Hnew的第二行记录每次更新的流量频率si和对应的时间窗序列Ti,数据包所属流量在与本次更新对应的时间窗相邻的上一时间窗的时间窗序列为T-1,将本次更新的时间窗序列T与Ti进行比较,若TTi+1,则记T-1对应的时间窗内数据包所属流量的流量频率sT-1为0,否则,记为si;将本次更新的时间窗序列T对应的流量频率s和相邻的上一时间窗对应的流量频率sT-1进行比较,若sT-1+f≤s,则判断当前数据包所属流量达到流量高峰,其中f为流量频率阈值,输出时间窗序列T作为高峰时间窗序列Tk;S3:哈希表Hnew的第三行中每个存储空间包含两个部分,分别存储2个最近的高峰时间窗序列,记为Tk-1和Tk-2,和n个最近的高峰时间窗序列间隔ti-n,ti-n+1,…,ti-1;若当前高峰时间窗序列与上一次高峰时间窗序列连续,即Tk-1+1=T,则更新Tk-1为T,并结束本次数据包的检测处理;若当前高峰时间窗序列与上一次高峰时间窗序列不连续,则计算高峰时间窗序列间隔ti=Tk-1-Tk-2,并更新Tk-2为Tk-1,更新Tk-1为T;基于n个最近的高峰时间窗序列间隔的均值m和标准差x,判断ti是否在区间[m-x,m+x]内,若是,则认为该数据包所属流量可能存在高峰周期性,并更新n个最近的高峰时间窗序列间隔,即使用本次计算的高峰时间窗序列间隔ti覆盖n个最近的高峰时间窗序列间隔中最旧的高峰时间窗序列间隔ti-n;S4:哈希表Hnew的第四行中每个存储空间包含两个部分,分别存储正投票vp和负投票vn;若在S3中判断该数据包所属流量可能存在高峰周期性,统计vp加1,否则vn加1,若比值vpvn超过分数阈值tp,则判断当前数据包所属的流量为周期性流量,输出对应流量的键值和周期。
全文数据:
权利要求:
百度查询: 浙江大学 一种基于草图的流量高峰周期检测方法及平台
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。