首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于档案热度的档案管理方法、装置、设备及存储介质 

申请/专利权人:浙江星汉信息技术股份有限公司

申请日:2023-10-25

公开(公告)日:2024-06-11

公开(公告)号:CN117370272B

主分类号:G06F16/11

分类号:G06F16/11;G06F16/185;G06N3/0442;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.06.11#授权;2024.01.26#实质审查的生效;2024.01.09#公开

摘要:本发明公开了一种基于档案热度的档案管理方法、装置、设备及存储介质。其中,方法包括获取待管理档案在预设的过去时间段内的访问记录数据;将访问记录数据输入到预先训练的LSTM模型中进行访问频率预测,获得访问频率预测结果;基于访问频率预测结果和预设的访问热度等级确定待管理档案的预测热度等级;基于预测热度等级将待管理档案移动至对应的固态硬盘、机械硬盘或磁带中,实现了存储资源的合理分配,提高访问频率高的档案的访问效率,以及降低档案整体存储成本。

主权项:1.一种基于档案热度的档案管理方法,其特征在于,包括:获取待管理档案在预设的过去时间段内的访问记录数据;将所述访问记录数据输入到预先训练的LSTM模型中进行访问频率预测,获得访问频率预测结果;其中,所述LSTM模型的训练过程包括:设定损失函数最小化作为LSTM模型的训练目标;为LSTM网络中的权重和偏差设置随机化种子,进行随机初始化;定义原始档案访问特征时序序列为Fo={f1,...,fn},其中n为档案总数,ft为第t个档案的时序,t∈[1,n];将访问记录数据划分为训练集和测试集;对训练集进行预处理,采用标准的z-score标准化方法,标准化后的训练集可以表示为:F'train={f'1,...,f'n}, ,其中,1≤t≤L,t为档案序号,L为模型展开步长;将档案访问IO记录作为模型的输入数据,传递至模型输入层;在模型输入层,将档案访问IO记录传递至隐藏层,经过LSTM神经元的信息前向传递处理;在LSTM隐藏层输出后,连接一个softmax层,以输出各类访问热度的概率分布;根据softmax层的输出,选择最大概率值对应的类标签作为档案的访问热度等级预测结果;使用交叉熵损失函数作为训练过程中的损失函数,以衡量模型预测结果与真实标签之间的差异;训练完成后,使用测试集对模型进行评估;基于所述访问频率预测结果和预设的访问热度等级确定所述待管理档案的预测热度等级;基于所述预测热度等级将所述待管理档案移动至对应的固态硬盘、机械硬盘或磁带中。

全文数据:

权利要求:

百度查询: 浙江星汉信息技术股份有限公司 基于档案热度的档案管理方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。