首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于经由多个数据拥有方训练模型的方法、装置及系统 

申请/专利权人:支付宝(杭州)信息技术有限公司

申请日:2022-04-15

公开(公告)日:2024-05-31

公开(公告)号:CN114819182B

主分类号:G06N20/00

分类号:G06N20/00;G06N3/04;G06N3/098

优先权:

专利状态码:有效-授权

法律状态:2024.05.31#授权;2022.08.16#实质审查的生效;2022.07.29#公开

摘要:本说明书实施例提供了用于经由多个数据拥有方训练模型的方法、装置及系统。在该方法中,各个第二数据拥有方根据第一数据确定出与各个第一数据相交的第二特征数据,执行下述主循环过程,直至满足第一循环结束条件:针对每个训练单元,利用第一训练样本和第二训练样本对参与该训练单元训练的第一模型、第二模型和第三模型进行协同训练,主服务器对各个训练单元的经过训练的第一模型和或第三模型进行联邦聚合,以得到对应的第一全局模型和或第三全局模型,在各个第一数据拥有方处和或各个从服务器处,根据第一全局模型对第一模型进行更新和或根据第三全局模型对第三模型进行更新。

主权项:1.一种用于经由多个数据拥有方训练模型的方法,所述多个数据拥有方包括多个第一数据拥有方和多个第二数据拥有方,每个第一数据拥有方具有第一模型以及按照水平切分方式切分的第一数据,每个第二数据拥有方具有第二模型以及按照垂直切分方式切分的第二数据,所述方法包括:在各个第二数据拥有方处,利用PSI算法根据各个第一数据拥有方所拥有的第一数据从该第二数据拥有方所拥有的第二数据中确定出与各个第一数据相交的第二特征数据;将每个第一数据拥有方所拥有的第一数据以及与该第一数据相交的各个第二数据拥有方所拥有的第二特征数据确定为一个训练单元;执行下述主循环过程,直至满足第一循环结束条件:针对每个训练单元,利用该训练单元中的至少部分第一数据作为第一训练样本以及各个第二数据拥有方所拥有的与所述第一训练样本相交的第二特征数据作为第二训练样本,对参与该训练单元训练的第一数据拥有方的第一模型、所述各个第二数据拥有方的第二模型以及参与该训练单元训练的从服务器的第三模型进行协同训练,其中,所述第一模型和所述第二模型包括神经网络模型的前N层,所述第三模型包括所述神经网络模型的除所述前N层以外的剩余层;在主服务器处,对从各个训练单元获取的经过训练的第一模型和或第三模型进行联邦聚合,以得到针对第一模型的第一全局模型和或针对第三模型的第三全局模型;以及在各个第一数据拥有方处和或各个从服务器处,根据所述第一全局模型对第一模型进行更新和或根据所述第三全局模型对第三模型进行更新。

全文数据:

权利要求:

百度查询: 支付宝(杭州)信息技术有限公司 用于经由多个数据拥有方训练模型的方法、装置及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。