买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:安天科技集团股份有限公司
摘要:本发明提供了一种衍生数据的去重方法,应用于计算机安全领域,所述方法包括:对目标资源包进行处理,获取目标资源包对应的初始文件列表和任一初始文件对应的衍生文件列表,并基于衍生文件对应的标识向量与任一关键标识向量,获取初始文件对应的相似度列表;根据衍生文件对应的标识向量与任一关键标识向量之间的相似度,确定出衍生文件为初始文件对应的第一类衍生文件还是初始文件对应的第二类衍生文件且对初始文件对应的第一类衍生文件和初始文件对应的第二类衍生文件分别处理;重复上述步骤获取初始文件对应的目标结构树。本发明提供的一种衍生数据的去重方法,能够减少重复文件占用的内存空间,在对文件进行处理时节省大量时间,提高了效率。
主权项:1.一种衍生数据的去重方法,其特征在于,包括如下步骤:S100、对目标资源包进行处理,获取目标资源包对应的初始文件列表A={A1,A2,……,Am},Ai是指第i个初始文件,i=1……m,m为初始文件数量;S200、获取Ai对应的格式且根据Ai对应的格式,获取Ai对应的衍生文件列表Ai'={Ai1,Ai2,……,Ain},其中,Aij是指第j个衍生文件,j=1……n,n为衍生文件数量;S300、获取Aij对应的标识向量A1ij,A2ij,……,Asij,其中,Arij是指Aij对应的标识向量中第r个bit值,r=1……s,s为标识向量的bit位数量;S400、基于Aij对应的标识向量与关键标识集中任一关键标识向量,获取Aij对应的相似度列表Fij=F1ij,F2ij,……,Fzij,Fxij是指Aij对应的标识向量与第x个关键标识向量对应的相似度,x=1……z,z=n-1;S500、根据Fxij,获取Ai对应的第一类衍生文件和Ai对应的第二类衍生文件且对Aij对应的第一类衍生文件和Aij对应的第二类衍生文件分别处理;S600、重复S200-S500步骤,直到Ai对应的数据结构中任一层级的所有衍生文件均为第二类衍生文件,获取Ai对应的目标结构树。
全文数据:
权利要求:
百度查询: 安天科技集团股份有限公司 一种衍生数据的去重方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。