买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:清华大学
摘要:本公开属于信息存储技术领域,具体而言涉及一种日志结构合并树的文件合并方法、装置、电子设备及存储介质。本方法首先根据用户的近期查询时间范围、近期写入记录和历史合并记录,统计出用户的常用查询时间范围和被查序列、当前数据写入频率和系统的平均合并速度;合并时从时间较近期往时间较远期遍历顺序文件,计算每个可能的文件合并候选集对常用查询的最终收益;选择收益最高的文件合并候选集的最常被查序列进行合并,合并完将结果文件替换被合并的文件。本方法根据用户的写入速率,常用查询区间来计算每次合并对查询的收益,提高了合并操作的灵活性和对用户造成的即时收益。本方法可广泛应用于信息存储技术领域中。
主权项:1.一种日志结构合并树的文件合并方法,其特征在于,包括:步骤1、统计用户使用频率最高的查询时间范围、查询时间序列的频繁项集、用户当前写入文件的速率和文件合并平均速度;步骤2、从用户写入文件的生成时间较近期往时间较远期,计算每个可能的文件合并候选集对常用查询的最终收益,得到合并收益最大的文件合并候选集;步骤3、将所述合并收益最大的文件合并候选集的最常被查序列进行合并,将合并结果文件替换被合并的文件;所述从用户写入文件的生成时间较近期往时间较远期,计算每个可能的文件合并候选集对常用查询的最终收益,得到合并收益最大的文件合并候选集,包括:1从用户写入文件的生成时间较近期往时间较远期,依次遍历用户写入文件的文件列表;2定义每一个可合并的连续文件段为文件合并候选集,根据用户合并平均速度,遍历所述文件列表中的所有文件合并候选集,计算各文件候选集的所需合并时间;3根据各文件候选集的相应用户写入速率和用户使用频率最高的查询时间范围,从文件列表中过滤掉合并后不被用户常用查询使用的文件合并候选集,得到多个第一文件合并候选集;4分别记录各第一文件合并候选集中使用户常用查询减少的磁盘寻道次数,将用户常用查询减少的磁盘寻道次数与合并生效的时间范围的乘积定义为合并收益;5遍历所有所述第一文件合并候选集,重复步骤4,得到各第一文件合并候选集的合并收益,从各第一文件合并候选集的合并收益中,选出合并收益最大的文件合并候选集;将所述收益最大的文件合并候选集的最常被查序列进行合并,将合并结果文件替换被合并的文件,完成日志结构合并树的数据合并,包括:1设定文件合并次数的阈值,对所述合并收益最大的文件合并候选集进行判断,若合并收益最大的文件合并候选集被合并的次数大于设定阈值,则对合并收益最大的文件合并候选集中的所有时间序列进行合并,并使该合并的大文件替换被合并的原文件;若合并收益最大的文件合并候选集被合并的次数小于或等于设定阈值,则将合并收益最大的文件合并候选集中的查询时间序列的频繁项集进行合并,并使该合并的大文件替换被合并的原文件;2对所述合并后的大文件中的合并次数进行更新,完成日志结构合并树的数据合并。
全文数据:
权利要求:
百度查询: 清华大学 一种日志结构合并树的文件合并方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。