首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于继承联邦学习的异构软件缺陷预测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨理工大学

摘要:本发明涉及联邦学习、软件缺陷预测技术领域,公开了一种基于继承联邦学习的异构软件缺陷预测方法,解决了软件缺陷预测中单一数据集的数据不充分以及多源数据带来的数据异构和隐私性问题。该方法包括:对各本地数据集采用综合过采样SyntheticMinorityOver‑samplingTechniquecombinedwithTomekLinksSMOTETomek算法和核主成分分析KernelPrincipalComponentAnalysis,KPCA算法进行预处理;在本地训练阶段加入继承私有模型InheritedPrivateModels,IPM,将历史训练中的模型知识进行迁移,共同参与本轮训练;在全局聚合阶段引入差异感知协作Discrepancy‑awareCollaboration,DC算法,考虑数据分布的情况下重新分配聚合权重。在迭代优化上采用了Ranger算法,由于参数更新上加入了多种不可逆的混合运算,因此能够加速收敛的同时有效保护数据隐私安全。

主权项:1.一种基于联邦学习的异构软件缺陷预测方法,包括以下步骤:步骤一:对参与方的本地数据集采用综合过采样SMOTETomek算法进行数据增强与清洗,得到近似平衡的本地数据;步骤二:对近似平衡的各本地数据集采用核主成分分析KernelPrincipalComponentAnalysis,KPCA算法进行最优特征筛选,达到特征维度一致;步骤三:各参与方将特征维度一致的数据集划分本地训练数据和测试数据。中央服务器采用额外选择的数据集用作全局测试,并构建初始卷积神经网络模型;步骤四:首轮通信中,参与方计算本地与全局数据分布差异,连同数据量大小上传至中央服务器。服务器计算各参与方差异聚合权重并下发初始模型;步骤五:参与方将本地训练数据输入模型进行个性化,同时将包含历史本地模型知识的IPM用于监督模型更新。训练结束后,本地模型与IPM以权值动态更新的形式加权平均更新IPM;步骤六:各参与方将经过Ranger算法更新得到的模型参数以隐私保护的形式上传至中央服务器,并将本地测试数据输入模型,计算其混淆矩阵以及AUC、G-mean指标;步骤七:中央服务器将各参与方的模型参数通过差异权重进行聚合,获得新一轮的全局模型下发给每个参与方,并将全局测试数据输入该模型,计算全局测试混淆矩阵以及AUC、G-mean指标。重复步骤五到步骤七直至达到最大训练轮数;步骤八:将各参与方与服务器将每轮测试得到的AUC、G-mean指标绘制成收敛曲线,并画出末轮模型预测的混淆矩阵以直观展现出训练过程与模型性能的变化趋势。

全文数据:

权利要求:

百度查询: 哈尔滨理工大学 基于继承联邦学习的异构软件缺陷预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。