申请/专利权人:拓尔思天行网安信息技术有限责任公司
申请日:2022-12-13
公开(公告)日:2024-06-14
公开(公告)号:CN118194029A
主分类号:G06F18/214
分类号:G06F18/214;G06N20/00
优先权:
专利状态码:在审-公开
法律状态:2024.06.14#公开
摘要:本公开是关于一种纵向联邦XGBoost训练方法、系统、设备、介质及产品,通过利用索引矩阵和秘密共享两种形式替代原始数据和标签的交互,使得Guest方和Host方均无法知道对方的数据;在保证安全性的同时,利用秘密共享的加法同态性保证了节点分裂和节点权重计算的准确性,从而保证模型是无损的,同时,计算方和数据方仅使用较少的交互次数即可高效完成模型的训练。
主权项:1.一种纵向联邦XGBoost训练方法,其特征在于,Guest方包括第一数据方和第一计算方,Host方包括第二计算方包括和第二数据方,包括:将所述第一数据方的第一索引矩阵和所述第二数据方的第二索引矩阵均发送给所述第一计算方和所述第二计算方,所述第一索引矩阵和所述第二索引矩阵是根据各自样本对每个特征进行排序获取的;基于秘密共享的方式将样本标签划分为正常标签和加密标签,将所述正常标签发送给所述第一计算方,将所述加密标签发送给所述第二计算方,所述第二计算方具备用于解密所述加密标签的私钥;在正常标签的第一索引矩阵中获取与所述第一计算方当前样本的第一交集样本,在加密标签的第二索引矩阵中获取与所述第二计算方当前样本的第二交集样本;通过分桶数对所述第一交集样本和所述第二交集样本确定候选分裂点,将第一交集样本和所述第二交集样本划分为左、右两个子集,计算每个分裂点的信息增益,并基于所述信息增益确定最优分裂点;对所述第一交集样本和所述第二交集样本的最优分裂点所在位置的节点进行分裂,直至满足迭代条件或样本集合不能再划分,获取多个所述Guest方和所述Host方的决策树,基于多个所述决策树获取纵向联邦XGBoost模型。
全文数据:
权利要求:
百度查询: 拓尔思天行网安信息技术有限责任公司 纵向联邦XGBoost训练方法、系统、设备、介质及产品
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。