首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

针对非独立同分布医疗场景下的联邦学习方法和装置 

申请/专利权人:之江实验室

申请日:2023-08-18

公开(公告)日:2024-06-28

公开(公告)号:CN117094412B

主分类号:G06N20/00

分类号:G06N20/00;G16H50/20;G16H10/60;G06F21/60;H04L9/00

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2023.12.08#实质审查的生效;2023.11.21#公开

摘要:本发明公开了一种针对非独立同分布医疗场景下的联邦学习方法,本发明首先将类别标签变量分布相近的医疗机构分在同一个簇内,训练过程中,先对在每个簇内的本地训练后得到的本地模型权值进行联邦平均得到对应簇模型的更新权值,从而能够减少由于数据不平衡对准确预测联邦平均结果的影响,然后将能够获得较为准确的联邦平均结果的各个簇模型的更新权值进行整合得到当前迭代的全局模型权值,通过多次迭代得到能够准确对疾病诊断、用药推荐以及治疗方案等医疗问题进行预测的全局模型。本发明还公开了一种针对非独立同分布医疗场景下的联邦学习装置和存储介质。

主权项:1.一种针对非独立同分布医疗场景下的联邦学习方法,其特征在于,包括:对每个医疗机构的类别标签变量分布进行加密,并将加密后类别标签变量分布发送至中心服务器;每个医疗机构通过聚类KL散度矩阵划分到各聚类簇中从而构建多个簇模型,所述KL散度矩阵是通过计算不同医疗机构的加密后类别标签变量分布间的KL散度获得;通过中心服务器从各聚类簇随机选择U个簇,将除了批标准化层外的全局模型权值发送至U个簇中的每个簇模型,将所述每个簇模型的权值发送至对应簇内随机选择的医疗机构,通过随机选择的医疗机构进行本地训练得到本地模型权值,将多个本地模型权值分别发送中心服务器进行联邦平均以更新对应簇模型的权值,通过中心服务器对U个簇模型的更新权值进行整合得到更新后的全局模型权值,通过多轮的更新全局模型权值得到最终全局模型;所述类别标签变量为疾病诊断、推荐用药和治疗方案;各医疗机构接收最终全局模型的权值以更新本地模型得到最终本地模型;每个医疗机构通过聚类KL散度矩阵划分到各聚类簇中,包括:1基于医疗机构的数量设定聚类簇数集合,从聚类簇数集合中选择聚类簇数,从KL散度矩阵中随机选择聚类簇数个KL散度数据点,将选择的KL散度数据点作为簇中心的初始坐标;2计算KL散度矩阵中的其他KL散度数据点分别到簇中心的初始坐标的距离,并将其他KL散度数据点分别划分至距离最近的簇中心的初始坐标所在的簇内;3从KL散度矩阵中再次随机选择聚类簇数个KL散度数据点以更新簇中心的初始坐标;4迭代步骤1-3,直至簇中心坐标不发生变化,停止迭代,得到选择的聚类簇数对应的聚类结果,计算所述聚类结果的轮廓系数;5将聚类簇数集合中最大轮廓系数对应的聚类簇数作为最优聚类簇数,通过最优聚类簇数对应的聚类结果将类别标签变量分布相近的医疗机构划分至同一个簇内,划分至同一簇内的医疗机构的本地模型构建所在簇的簇模型;每个医疗机构获得类别标签变量分布,包括:每个医疗机构接收中心服务器指令后,采用哈希函数对每个类别标签变量字符串进行加密得到每个类别标签变量字符串哈希值;将每个类别标签变量的样本数占总样本数的比例按照类别标签变量字符串哈希值进行排序得到类别标签变量分布;通过中心服务器对U个簇模型的更新权值进行整合得到更新后的全局模型权值,包括:将在U个簇内的每个簇的样本数与U个簇的样本总数的比值作为每个簇的样本数占比;在U个簇内将每个簇的样本数占比与对应簇模型的更新权值相乘后连加得到更新后的全局模型权值;每个簇模型的权值包括初始或每个迭代后的由中心服务器发送的除批标准化层外的全局模型权值和每个簇模型自身的批标准化层权值。

全文数据:

权利要求:

百度查询: 之江实验室 针对非独立同分布医疗场景下的联邦学习方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。