买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川大学
摘要:本发明涉及一种基于关键特征提取的数据共享方案,具体包括:系统建模:该方案由多个数据提供方和一个区块链平台组成。特征提取阶段:各数据提供方利用变分自编码器VAE处理本地数据,提取鲁棒特征并计算关键特征。初次共享阶段:各数据提供方对提取出的关键特征进行随机噪声处理、打包和加密后上传至区块链平台。各方随后从区块链中提取关键特征,形成全局共享特征集合,并结合本地鲁棒特征用于后续联邦学习任务。联邦学习阶段:各方基于特征集合和本地特征执行联邦学习,分布式协作训练统一机器学习模型,直至模型拟合或达到预定迭代次数。每次模型更新时采用同态加密技术对全局参数加密聚合,确保隐私安全,防止通过模型参数逆向推导泄露隐私。
主权项:1.一种基于关键特征提取的数据共享方案,其特征在于,所述方法包括以下步骤:步骤1、联邦学习参与各方首先对自己持有的数据集进行分析,提取本地数据的数据摘要信息,随后将数据摘要信息加密后上传至区块链,这些信息应该包括数据的类型、分布、大小以及是否结构化等,但不包含任何个人或敏感数据;步骤2、当数据请求者产生数据请求需求时,向区块链系统发送数据请求信息;步骤3、区块链系统基于区块链上的数据摘要信息和数据请求信息,通过相似度匹配算法筛选出合适的数据提供者集合P参与联邦学习;步骤4、系统将数据共享请求转发给数据提供者集合P中的每个成员;步骤5、P中的每个成员使用本地原始数据通过本章设计的特征提取方法提取出本地数据的关键特征,并对该关键特征添加随机噪声后上传到区块链;步骤6、基于P中所有成员上传的关键特征构建全局共享集合;步骤7、P中的每个成员下载全局共享的特征集合,并结合自己的本地数据参与模型的训练,以降低各数据提供者的数据异质性;步骤8、P中的每个成员在本地训练模型后,将模型更新加密并上传到区块链;步骤9、数据请求方轮询收集所有参与方上传的模型更新,进行模型聚合以形成新的全局模型参数,并将聚合后的全局模型参数再次分发给所有参与方,直到模型拟合或达到迭代次数。
全文数据:
权利要求:
百度查询: 四川大学 一种基于关键特征提取的数据共享方案
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。