买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江大学;杭州高新区(滨江)区块链与数据安全研究院
摘要:本发明提出了一种基于分层对齐数据块的图表示方法,通过分类分层的图存储方法,将大规模图数据中不同大小的顶点数据分类、分层地存储到不同的数据格式中,提升块设备访问图数据的访存效率。同时,本发明还提出了一种分层的对齐图数据块管理方式,将不同大小的顶点数据组织成多层不同大小的对齐图数据块,以提高小顶点的IO效率,并最小化大顶点的元数据管理开销。
主权项:1.一种基于分层对齐数据块的图表示方法,其特征在于,包括:获得以压缩稀疏行数组格式进行表示的图数据,所述图数据包含索引数据和边数据;保存图数据中所有顶点;通过索引数据,计算并保存图数据中每个顶点邻居顶点的个数,即度信息;通过结合索引数据和边数据,保存图数据中每个顶点的邻居顶点;根据度信息,将图数据中所有顶点分为三种类型,分别是迷你顶点、中度顶点和超级顶点;将迷你顶点的邻居顶点通过内嵌元数据的方式存储,获得迷你顶点的索引存储格式;将中度顶点的邻居顶点通过分层对齐数据块的方式存储,获得中度顶点的块索引存储格式和数据块存储格式;将超级顶点的邻居顶点通过大页数据块的方式存储,获得超级顶点的大页索引存储格式和大页数据块存储格式;将迷你顶点、中度顶点和超级顶点各自的存储格式分成两个区域进行管理,分别为内存区域缓存区和块设备持久存储区,使用分块文件大小比例缓存大小分配策略管理内存区域缓存区的大小,最终获得图数据的内存区域缓存区和块设备持久存储区。
全文数据:
权利要求:
百度查询: 浙江大学 杭州高新区(滨江)区块链与数据安全研究院 一种基于分层对齐数据块的图表示方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。