首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于滑动窗口的标签感知图形流草图构建方法及应用 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南开大学

摘要:本发明属于图数据处理的技术领域,更具体地,涉及一种基于滑动窗口的标签感知图形流草图构建方法及应用。该方法首先,对于图数据流中的每个项目,使用现有的哈希方法和指纹技术获得项目的初始地址和指纹。其次,通过矩阵分块技术根据项目的顶点标签对其进行定位,并使用线性同余方法生成地址候选列表。稍后,设计双计数器机制高效存储项目的边缘标签及对应权重。最后,使用额外池存储矩阵中的冲突项目。本发明能够解决图数据流草图构建领域中的信息缺失问题,将顶点标签、边缘标签和时间戳高效嵌入草图,丰富了其表达能力。基于构建的草图,能够支持下游更多种类的查询和分析,例如交通网络中的路线规划以及社交网络中的虚假新闻检测。

主权项:1.基于滑动窗口的标签感知图形流草图构建方法,其特征在于,包括以下步骤:S1、获取带有标签和时间戳的异质图数据流;S2、根据图数据流中到达项目的时间戳对窗口进行滑动;所述步骤S2中设定滑动窗口的大小是W时间单位,通过将时间窗口划分为k个子窗口,每个子窗口包含Wk时间单位,在仅保留一个最近子窗口的起始时间tn的基础上可以完成草图的有效滑动,通过比对当前时间t与tn,t≤tn+Wk,则开启一个新的子窗口并剔除最远子窗口,实现子窗口的更新并完成整体窗口的滑动;S3、确定图数据流中的任一项目在矩阵中的存储位置;所述步骤S3中针对处理的异质图数据流,假定当前到达图数据流的项目表示为e=A,B,lA,lB,le,w,t,其中A和B为项目的两个顶点标识符,lA和lB是顶点对应的顶点标签,le是项目的边缘标签,w是项目的权重,t是项目的时间戳,标识项目到达图数据流的时间;首先利用项目的两个顶点标签lA和lB信息确定其所属的初始矩阵块,然后提取项目本身的标识符A和B作为信息在选定的矩阵块中游走,最终确定其在矩阵中的存储位置,并使用双计数器机制高效记录其到达的边缘标签及对应权重;3.1、根据顶点标签确定项目所属的矩阵块;为了高效存储项目的顶点标签,使用矩阵分块思想,将具有相同顶点标签的项目聚集存储在同一个大块中,在不增加存储耗费的基础上完成顶点标签的嵌入,基于预先设置好的草图参数,包括矩阵宽度d、矩阵块宽度b,根据项目的两个顶点标签lA和lB得到对应的哈希值为HlA和HlB,进而将其转化为二维矩阵中每一维的定位标志HlA%m、HlB%m,其中m是一维中分块的数量,表示为db;由此,可以确定项目所属的矩阵块,该矩阵块的起始位置为b*HlA%m,b*HlB%m,该矩阵块的大小范围为:A∈b*HlA%m,b*HlA%m+bB∈b*HlB%m,b*HlB%m+b3.2、根据标识符信息确定项目所属的矩阵格;对项目的标识符A和B处理,得到哈希值以及对应的初始地址和指纹,分别为HA、HB;fA=HA%F、fB=HB%F,其中F是设定的指纹长度,根据已有的线性同余方法,使用标识符A和B的指纹fA、fB作为种子,使用公式 分别生成项目对应的地址候选序列{s1A,s2A,...,srA}、{s1B,s2B,...,srB},其中0≤siA≤b,0≤siB≤b,r是候选列表的长度,乘数T、增量I、模数M都是线性同余方程中的设定常量,依次检查候选列表并在项目选定的矩阵块中进行游走;若没有冲突,则完成项目在矩阵中的定位;3.3、使用双计数器机制,存储项目的边缘标签及对应权重;设计双计数器机制解决图数据流中同一项目多次以不同权重、不同边缘标签到达的统一性问题,定义数量计数器列表C={C1,C2,...,Ck}存储项目在不同时间窗口内的所有边缘的总体权重,此外,预定义一个质数列表PList={2,3,5,...},使用哈希函数将每一个边缘标签映射到独有的质数上,利用质数乘积的因式分解的唯一性定义标签计数器列表P={P1,P2,...,Pk},通过将多个时间点到达的具有不同权重、不同边缘标签的项目转化成质数,并乘入计数器列表P,从而在能够分解的情况下高效完成边缘标签的存储;S4、对矩阵中存在冲突的项目使用额外池进行存储;S5、融合存储矩阵和额外池两个部分,完成草图的最终构建。

全文数据:

权利要求:

百度查询: 南开大学 基于滑动窗口的标签感知图形流草图构建方法及应用

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。