北京科杰科技有限公司高海玲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京科杰科技有限公司申请的专利基于大数据文件集群的文件模糊拷贝方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119739537B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510243632.9,技术领域涉及:G06F9/50;该发明授权基于大数据文件集群的文件模糊拷贝方法及系统是由高海玲;高经郡;李钦设计研发完成,并于2025-03-03向国家知识产权局提交的专利申请。
本基于大数据文件集群的文件模糊拷贝方法及系统在说明书摘要公布了:本发明提供基于大数据文件集群的文件模糊拷贝方法及系统,涉及文件拷贝技术领域,包括对待匹配文件集提取文件内容、文件名和元数据特征向量,其中,文件内容特征向量基于深度学习模型编码获得。之后,利用分布式计算框架并行计算待匹配文件与目标文件集中文件的相似度得分,该得分通过加权计算文件内容、文件名和元数据特征向量相似度获得,并根据预设阈值筛选生成待复制文件列表。最后,分布式文件系统根据系统资源动态分配复制任务,基于数据块级别并行传输机制执行文件复制,并校验数据完整性,生成复制任务执行报告。本发明能够高效、准确地在大数据文件集群中进行模糊文件拷贝,提高了文件拷贝效率和准确性,降低了系统资源消耗。
本发明授权基于大数据文件集群的文件模糊拷贝方法及系统在权利要求书中公布了:1.基于大数据文件集群的文件模糊拷贝方法,其特征在于,包括: 获取待匹配文件集,对所述待匹配文件集中的每个文件进行特征提取,构建待匹配文件特征向量集,所述待匹配文件特征向量集包括每个文件的文件内容特征向量、文件名特征向量及文件元数据特征向量,其中所述文件内容特征向量通过深度学习模型对文件内容进行编码获得,所述文件名特征向量通过字符级别的编码模型对文件名进行编码获得,所述文件元数据特征向量包括文件大小、创建时间、修改时间的数值化表示; 基于分布式计算框架,将所述待匹配文件特征向量集划分为多个子任务,在所述分布式计算框架的多个计算节点上并行执行特征向量相似度计算,计算每个待匹配文件与目标文件集中文件的相似度得分,所述相似度得分通过对文件内容特征向量相似度、文件名特征向量相似度及文件元数据特征向量相似度进行加权计算获得,根据预设相似度阈值对所述相似度得分进行过滤,生成待复制文件列表; 将所述待复制文件列表提交至分布式文件系统的任务调度器,所述任务调度器根据系统资源状态动态分配复制任务的执行节点,在所述执行节点上启动文件复制进程,所述文件复制进程基于数据块级别的并行传输机制执行文件复制操作,对复制过程中的数据完整性进行校验,将复制完成的文件存储至目标存储位置,并生成复制任务执行报告。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科杰科技有限公司,其通讯地址为:100096 北京市海淀区东升科技园北街6号院10号楼11层101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。