首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

决策树模型的模型隐私、数据隐私及模型一致性保护方法 

申请/专利权人:南开大学

申请日:2023-08-31

公开(公告)日:2024-06-28

公开(公告)号:CN117077038B

主分类号:G06F21/62

分类号:G06F21/62;G06F18/243;G06N5/01

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2023.12.05#实质审查的生效;2023.11.17#公开

摘要:本发明公开了一种决策树模型的模型隐私、数据隐私及模型一致性保护方法。1构建模型隐私保护方案:由服务端根据决策树模型的结构,随机选择一个数据样本,将其决策过程生成算术电路,进而通过电路生成证明,在此之后可以由用户端对证明进行验证。2构建数据隐私保护方案:用户端加密隐私数据生成数据承诺和分支节点范围证明;服务端在决策树推断过程中进行范围证明验证。3模型一致性验证:用户端将完成了承诺和随机交换的一致性验证数据集发送给服务端;服务端执行决策树推断并返回分类结果;用户端验证服务端返回的分类结果的正确性和同一组样本明文和密文分类结果的一致性。

主权项:1.一种决策树模型的模型隐私、数据隐私及模型一致性保护方法,其特征在于:该方法包含以下步骤:步骤1,构建模型隐私保护方案构建模型隐私保护方案的目的在于,保证服务端在不泄露决策树模型本身任何信息的情况下,使得第三方相信已有模型能达到良好的分类效果,也就是保证模型隐私安全;由服务端根据可信决策树模型,随机选择一个数据样本进行决策,根据其决策过程构建一个零知识证明算术电路;然后由可信第三方根据构建好的算术电路进行可信初始化,生成公开参数:证明密钥和验证密钥,之后将这两个密钥发送给服务端;然后由服务端根据算术电路结构和证明密钥生成证明并将验证密钥和证明发送给用户端;最后由用户端根据验证密钥和证明进行验证;构建模型隐私保护方案,具体为:步骤1.1,在决策过程中记录如下数据:第一,决策结果决策路径叶子节点决策路径的兄弟节点哈希按照决策树模型使用属性顺序排列的样本的属性列表第二,记录决策树模型DT的认证决策树ADT,认证决策树中包含如下四类节点:①叶子节点:叶子节点存储内容为:叶子节点的哈希值leaf.Hash、叶子节点的分类leaf.class、叶子节点辅助信息leaf.sup;②根节点左子树的分支节点:分支节点存储内容为:各分支节点的哈希值node.Hash、指向子节点的指针node.lc和node.rc、各分支节点的决策属性node.att、各分支节点的决策阈值node.thr;③根节点右子树:随机数z;④根节点:根节点承诺CommADT;步骤1.2,构建的零知识证明算术电路分为三个部分,其功能分别为:第一部分,证明样本使用的属性均为该样本输入的属性,即对决策树模型使用的样本的属性进行属性检查;第二部分,证明决策过程的存在性,即证明在使用决策树模型对样本进行决策的过程中,每次决策都将样本的一个属性值与决策阈值进行比较,并根据各次决策结果获得了决策路径;第三部分,证明决策过程的有效性,即证明每次决策确实会根据属性值的不同有两种可能的不同结果;通过这三个部分,构建能够描述数据样本决策的完整过程的零知识证明算术电路;构建零知识证明算术电路的第一部分具体方法为:首先为数据样本的每个属性设计属性标签,其中样本第i个属性的属性标签为其中r′为有限域上的随机数;然后定义为按照决策树模型使用属性顺序排列的样本的属性列表,为中各属性添加属性标签,之后将输入决策过程中样本属性在中的出现次数记为最后构建算术电路验证和是否成立;在这一部分,将作为公开输入,作为私有输入,和r′作为辅助私有输入;构建零知识证明算术电路的第二部分具体方法为:将和pathx作为算术电路的私有输入,针对每一次决策,比较和表示样本x的第i个属性值,表示样本x第i个属性值对应的决策路径上的分支节点的决策阈值,如果那么比较结果输出1,反之输出0;之后将此比较结果与该分支节点的子节点选择方案作一致性比较,来验证决策路径是否由决策结果确定;验证时,需要将决策结果作为算术电路的公开输入,将其与决策路径中分支节点的指向子节点的指针通过算术电路构建关系,其中,分支节点的指向子节点的指针为node.lc,代表该分支节点的分支节点的指向子节点的指针为node.rc,代表该分支节点的构建零知识证明算术电路的第三部分具体方法为:需要将根节点承诺CommADT、叶节点作为公开输入,将决策路径和兄弟节点哈希作为私有输入;根据决策路径pathx、兄弟节点哈希siblingx中的哈希值和随机数z,按照认证决策树的构建方式,从叶子节点出发,逐层向上构建算术电路,该算术电路中根节点的哈希值为Comm';然后验证该根节点的哈希值Comm'和根节点承诺CommADT的一致性;步骤2,构建数据隐私保护方案构建数据隐私保护方案的目的在于,保证用户端在使用决策树模型进行预测的过程中不泄露个人数据,也就是保证用户的数据隐私安全;服务端需向用户端公开可信决策树模型的分支节点的集合,所公开的分支节点的集合包括分支节点划分条件的属性与阈值;用户端基于服务端公开的分支节点的集合,依次对每个分支节点的划分条件的阈值与对应属性的数据样本之差作范围证明,同时用户端针对每条数据样本,加密隐私数据生成数据承诺和分支节点范围证明,并将生成的数据承诺集合和分支节点范围证明集合发送给服务端;最后服务端在决策树推断过程中进行范围证明验证,给出决策树分类结果,并将结果发送给用户端;步骤3,构建模型一致性验证方案构建模型一致性验证方案的目的在于,实现用户端可验证基于密文的服务商采用预测模型和原始基于明文训练所得预测模型的一致性的方案,防止服务端作弊;用户端将完成了承诺和随机交换的一致性验证数据集发送给服务端;服务端执行决策树推断并返回分类结果;用户端验证服务端返回的分类结果的正确性和同一组样本明文和密文分类结果的一致性。

全文数据:

权利要求:

百度查询: 南开大学 决策树模型的模型隐私、数据隐私及模型一致性保护方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。