一种基于梯度提升树的局部可解释方法

导航：龙图腾网> 最新专利技术> 一种基于梯度提升树的局部可解释方法

申请/专利权人：华东师范大学

申请日：2020-06-23

公开（公告）日：2024-06-28

公开（公告）号：CN111753995B

主分类号：G06N20/00

分类号：G06N20/00;G06N3/0442;G06N3/0464;G06N3/0499;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2020.10.30#实质审查的生效;2020.10.09#公开

摘要：本发明公开了一种基于梯度提升树的局部可解释方法，将复杂的模型使用知识蒸馏得到梯度提升树模型，通过改良传统的计算平均不纯度减少量MDI重要性方法为各梯度提升树对节点信息增益贡献的加权平均，并以此进行排序得出输入特征的重要性排序得到局部可解释，从而做到对复杂模型的解释。本发明是一种通用的可解释方法，能够对多种领域的数据集进行提取解释，比如自然语言处理数据集、图像数据集和表格数据集。同时该方法可以使用子模块选择的方法利用局部解释推广应用到获取模型的全局解释。

主权项：1.一种基于梯度提升树的局部可解释方法，其特征在于，该方法包括以下具体步骤：步骤1：使用训练数据集对初始复杂模型进行参数训练，并提取出输入特征；步骤2：将训练好的模型进行知识蒸馏得到输入特征的软标签输出；步骤3：使用步骤1中得到的输入特征和步骤2中得到的输出软标签进行梯度提升树模型的训练，得到训练好的梯度提升树模型；步骤4：从训练好的梯度提升树模型中提取出特征重要性，对特征重要性进行排序，选择特征重要性较高的特征作为初始复杂模型的解释；其中：步骤1所述训练数据集为自然语言数据集、图像数据集及表格数据集；初始模型为基于注意力机制的长短期记忆网络、卷积神经网络及多层感知器；所述进行参数训练：自然语言数据集使用基于注意力机制的长短期记忆网络；图像数据集使用卷积神经网络；表格数据集使用多层感知器；步骤2所述进行知识蒸馏得到输入特征的软标签输出，其软标签输出公式为：其中，Labelsoft是指软标签输出，zi是指初始模型最后的输出，T是温度参数，i是指预测为第i类，j指预测任务总共的预测类别；步骤3所述的得到训练好的梯度提升树模型包括M个弱判别器，每个弱判别器都是决策树模型，其中M是梯度提升树模型的一个参数；步骤4所述从训练好的梯度提升树模型中提取出特征重要性，对特征重要性进行排序，选择特征重要性较高的特征作为初始复杂模型的解释，具体包括：特征重要性的计算公式为：其中，表示特征P的重要性期望，特征P是由K个数据构成，Pk即为特征的第k个数据；ImpPk即为特征的第k个数据的特征重要性，其中ImpPk中每个权重γmhmx即为训练好的梯度提升树模型中第m个弱判别器对整个模型的贡献程度，定义为归一化的第m个弱判别器在输入为Pk时的不纯度减少率，不纯度减少率是指弱判别器在预测特征Pk时，节点分割中用到Pk的不纯度减少量占总的不纯度减少量的比值；不纯度的计算是通过特征Pk在决策树模型中经过的划分节点n来计算，即GainPk,n＝in-pLinL-pRinR，其中in表示节点分裂的不纯度，而pL和pR分别代表样本分裂后达到nL和nR的部分；训练得到的梯度提升树模型中，Tm表示第m个弱判别器，即第m个决策树模型，并用Tmx表示输入样本为x时，其中样本x是包含多个特征P，决策树模型Tm在预测时对应的路径；特征P的重要性期望越高表明该特征对于模型决策越重要；将得到的全部特征按照从大到小排序，以此作为从梯度提升树模型中提取出的解释，同时也作为初始复杂模型的解释。

全文数据：

权利要求：

百度查询：华东师范大学一种基于梯度提升树的局部可解释方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种连续制备五氯化磷的装置

下一篇：一种公共卫生用预防传染病喷雾装置

相关技术

一种连续制备五氯化磷的装置

一种公共卫生用预防传染病喷雾装置

一种房建施工用安全防坠装置

一种单双缸风冷柴油机发电机组吸排汇流冷却风道

一种摆动机构及鼓风干燥箱

一种用于光伏发电装置的R型回转减速机

一种高选择性紧凑型超宽带滤波器的拓扑结构及滤波器

一种叠加机

一种纸尿裤生产用包边机

一种脱模剂集中供料装置

一种仓库物资搬运装置

一种带固定结构的冲压装置

树相关技术

一种树坑电动挖掘装置_辛万良_202322871504.8

一种古树生态指标监控系统_山东祥辰科技集团有限公司_202410645818.2

一种景观树固定装置_济南西城森泰置业有限公司_202322925932.4

基于组件树架构的动态布局方法和系统_成都中科合迅科技有限公司_202410457957.2

一种基于LSM树的数据遍历查询方法及相关设备_支付宝(杭州)信息技术有限公司_202410217427.0

一种基于极限梯度提升树模型的聚乙烯性能预测方法_华东理工大学_202410514127.9

基于信息传播树的网络信息检测方法、装置、设备和介质_平安科技(深圳)有限公司_202210416791.0

一种用于景观工程树的固定装置_丁志武_202322768107.8

一种营建榉树丰产母树林的方法_江苏农景生态建设有限公司_202410412499.0

一种基于梯度提升树的局部可解释方法_华东师范大学_202010580912.6

解释相关技术

基于可解释机器学习的水质软测量方法_南方海洋科学与工程广东省实验室(广州)_202410473133.4

基于深度学习的可解释心衰改善诊断方法及系统_大连大学_202410342781.6

一种基于梯度提升树的局部可解释方法_华东师范大学_202010580912.6

基于可解释的乳腺癌新辅助化疗pCR预测方法及系统_北京科技大学_202410417776.7

基于子模子集选择的可解释归因方法及系统_中国科学院信息工程研究所_202410214959.9

横波微测井解释方法及装置_中国石油天然气集团有限公司_202011204882.5

走滑断层的识别解释方法及装置_中国石油大学(北京)_202410052376.0

油气藏评价阶段建立地震解释速度模型的方法及装置_中国石油天然气股份有限公司_202011353037.4

一种网站验证码及图片视觉解释方法及装置_浪潮卓数大数据产业发展有限公司_202410182720.8

大模型可解释性的分析方法及装置_支付宝(杭州)信息技术有限公司_202410278728.4

局部相关技术

电气设备局部放电检测装置_华北电力大学(保定)_202410512909.9

钢管外圆局部修磨设备及工艺_常熟华新特殊钢有限公司_202410561231.3

一种开关柜局部放电监测装置_山西辉能科技有限公司_202410330395.5

一种局部数据的动态生成方法_凯盛融英信息科技(上海)股份有限公司_201910637589.9

一种GIS局部放电在线监测装置_贵州北盘江电力股份有限公司董箐分公司_202323016711.1

一种基于数字图像的基坑支护结构局部失稳变形监测方法_广东省源天工程有限公司_202410552727.4

一种基于轨迹跟踪的深度强化学习局部路径规划方法_西南大学_202410283054.7

一种局部导航避障方法及机器人_清华大学深圳国际研究生院_202210869565.8

结合行人局部特征和服饰属性分类的行人搜索方法、系统及存储介质_深圳市信义科技有限公司_202011414929.0

一种局部放电检测仪器的保护装置_中国石油化工股份有限公司_201910941668.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于梯度提升树的局部可解释方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务