首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种海量APK源码特征提取及相似分析方法_国家计算机网络与信息安全管理中心_202311441226.0 

申请/专利权人:国家计算机网络与信息安全管理中心

申请日:2023-11-01

公开(公告)日:2024-05-31

公开(公告)号:CN117591119B

主分类号:G06F8/41

分类号:G06F8/41;G06F8/53;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.05.31#授权;2024.03.12#实质审查的生效;2024.02.23#公开

摘要:本发明涉及软件检测技术领域,公开了一种海量APK源码特征提取及相似分析方法,首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件、本地化语言配置文件,提取到SMALI或JAVA源代码;再通过包名索引、启动类索引、固定目录识别方式,识别APK核心源码目录、第三方包目录、系统资源目录,并生成源码树;再对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型对进行不同程度的相似度加权。本发明降低分析资源投入和时间消耗,提升源码相似分析的准确度,能够实现在大规模APK数据分析场景的高性能分析。

主权项:1.一种海量APK源码特征提取及相似分析方法,其特征在于:具体按以下步骤执行:S1:首先输入两个APK文件,通过源码解析反编译方法提取到APK包的AndroidManifest文件和本地化语言配置文件,提取到SMALI或JAVA源代码;S2:通过包名索引、启动类索引和固定目录识别方式,识别APK核心源码目录、第三方包目录和系统资源目录,并生成源码树;S3:对核心源码目录中的文件进行分析,计算文件HASH,提取源码文件中字符串类声明特征表示作为加权特征;S4:计算拟进行分析的两棵源码树结构的相似度情况,根据源码目录的类型进行不同程度的相似度加权,其中核心源码目录相似的权重+2、第三方包目录+1、系统资源目录0;S5:计算每棵树的末端节点源码文件,源码文件HASH一致的权重+2,源码文件特征表示相似的权重+1;S6:计算两棵树的相似度情况,按照双向对比取平均数,生成源码树相似度,具体通过计算A树在B树中的覆盖率得出s1、计算B树在A树中的覆盖率得出s2,最后通过s1+s22计算输出树结构相似度ST,如式1; S7:通过SimHash算法分析的两个APP的AndroidManifestH和本地化语言配置的相似程度,通过计算汉明距离输出相似度比例,输出相似性属性SC和SL;如式2-式3;SC=similaritysimhashCa,simhashCb式2SL=similaritysimhashLa,simhashLb式3S8:最后将树结构相似度、AndroidManifest相似度、本地化语言配置相似度三个数据,按照比例x:y:z加权求和计算输出相似度、x、y、z是树结构相似度和AndroidManifest相似度、本地化语言配置相似度三项相似度的权重系数,通过加权求和计算最终的APP相似度S;如式4;

全文数据:

权利要求:

百度查询: 国家计算机网络与信息安全管理中心 一种海量APK源码特征提取及相似分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。