【发明授权】一种基于机器学习分析规则的分值型模型优化方法_北京领雁科技股份有限公司_202311822048.6

申请/专利权人：北京领雁科技股份有限公司

申请日：2023-12-27

公开（公告）日：2024-06-21

公开（公告）号：CN117725527B

主分类号：G06F18/2431

分类号：G06F18/2431;G06F18/22;G06N5/01;G06N20/00

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2024.04.05#实质审查的生效;2024.03.19#公开

摘要：本发明公开了一种基于机器学习分析规则的分值型模型优化方法，以人工智能算法在模型组合策略持续优化应用为设计理念，在监督学习、无监督学习和粗糙集与粒计算等理论指导下，实现自动化、智能化地优化模型组合策略，能够将触发模型的相关数据通过AI技术进行多粒度分析，针对不同的业务场景，通过多种优化策略进行学习试算，能克服业务专家的主观性和试算有限性，更充分挖掘隐藏信息，得到更优的组合策略，辅助业务人员实现自动化地优化模型，辅助业务更快更好地优化模型，快速发现模型下规则的关联关系及其参与度，辅助业务理解可疑案例的特征识别点，进而更好地识别可疑案例。

主权项：1.一种基于机器学习分析规则的分值型模型优化方法，其特征在于：包括以下步骤：获取在专家模型的优化周期内的已认定案例数据、排除案例数据和规则预警数据，所述已认定案例信息数据包括：在优化周期内已认定案例触发所需优化模型的客户信息、账户信息、案例日期和规则集，所述排除案例信息数据包括在优化周期内排除案例触发所需优化模型的客户信息、账户信息、案例日期和规则集，所述规则预警信息数据包括在优化周期内触发规则的所有客户及其在每日的回顾周期内所有规则集；根据所述已认定案例数据和排除案例数据并结合预设算法分析所述专家模型中的核心规则组以及规则参与度，得到机器学习规则分析结果，所述预设算法包括随机森林分类算法、关联规则算法、最小属性约简算法以及递归特征消除算法，其中，包括：将已认定案例数据和排除案例数据合并为第一数据集；对所述第一数据集进行预处理并基于规则哑变量离散化后得到第一待分析数据集；采用预设算法和递归特征消除算法分别对所述第一待分析数据集进行核心规则组分析，得到与所述预设算法对应类型的核心规则组分析结果，还包括：采用关联规则算法进行核心规则组分析，得到第二类核心规则组分析结果，步骤为：步骤B1：遍历所述第一待分析数据集中的所有特征，获取第一待分析数据集中特征两两组合的集合，记为频繁A项集集合LA；步骤B2：遍历所述第一待分析数据集中的所有特征，在第一待分析数据集中寻找与集合LA存在组合的特征，并组合为新的项集，记为频繁B项集集合LB；步骤B3：重复执行所述步骤B2，直到找不到频繁k项集，计算各频繁项集的支持度、置信度和提升度，得到频繁项集计算结果；步骤B4：从所述频繁项集计算结果中选取同时大于最小支持度、最小置信度和最小提升度的频繁项集作为第二类核心规则组；采用随机森林分类算法对所述第一待分析数据集进行规则参与度分析，得到规则参与度分析结果，包括：步骤E1.1：令第一待分析数据集为，E为所述第一待分析数据集中的样本个数，单棵决策树的输入样本的个数为：E个从第一待分析数据集中有放回的随机抽取E个训练样本；步骤E1.2：令G为所述第一待分析数据集的特征总数，，当我们在每颗决策树的每个节点上进行分裂时，从G个输入特征里随机选择g个输入特征作为属性集，通过基尼指数公式计算属性集中每个属性的基尼指数，选择基尼指数最小的属性进行分裂；步骤E1.3：重复步骤E1.1和步骤E1.2，让每棵决策树不断分裂，直到满足停止分裂条件后停止分裂，生成对应数量的第二决策树，通过投票法从第二决策树中取单棵树分类结果最多的类别作为第二随机森林分类结果；步骤E1.4：分别计算所述第二随机森林分类结果中每棵决策树的预期贡献率得到第二预期贡献率，对所述第二预期贡献率进行平均归一化后得到规则重要度；步骤E2：根据已认定案例数据得到规则贡献率，所述规则贡献率表示已认定案例中的规则触发量与已认定案例数的比率，公式为：其中，rule_contribute表示规则贡献率，r1表示已认定案例中的规则触发量，ra表示已认定案例数；步骤E3：规则相似度表示模型内规则之间所被触发客户的相似及包含情况，采用皮尔逊相似度函数计算规则相似度，计算公式为：其中，rule_similar表示规则相似度，rc1表示规则1所被触发客户的离散化数组，rc2表示规则2所被触发客户的离散化数组；步骤E4：根据已认定案例数据和排除案例数据得到规则分别率，规则分别率表示规则在已认定案例中的触发量与在排除案例中的触发量之间的比率，公式为：其中，rule_difference表示规则分别率，r1表示已认定案例中规则触发量，r2表示排除案例中规则触发量；步骤E5：由所述规则重要度、规则贡献率、规则相似度和所述规则分别率共同组成所述规则参与度分析结果；由所述核心规则组分析结果和所述规则参与度分析结果共同构成所述机器学习规则分析结果；根据所述机器学习规则分析结果和所述规则预警数据对所述专家模型执行分值型模型优化策略，得到分值型模型优化结果，包括：步骤X1：将已认定案例数据和排除案例数据合并为第二数据集；步骤X2：对所述第二数据集进行预处理并基于规则哑变量离散化后得到第二待分析数据集；步骤X3：获取所述机器学习规则分析结果中的第二类核心规则组和规则重要度；步骤X4：计算所述规则贡献率；步骤X5：将所述规则重要度和规则贡献率加权得到规则分档分值，公式为：其中，rule_grading_score表示规则分档分值，rule_importance表示规则重要度；将规则分档分值进行标准化得到规则分档标准值，当所述规则分档标准值大于等于0.8为第一档，当所述规则分档标准值大于等于0.3且小于0.8为第二档，当所述规则分档标准值小于0.3为第三档；步骤X6：分析规则分档标准值并对所述第二类核心规则组中的规则进行规则分值调档：当第二类核心规则组的规则贡献率为1时，将第二类核心规则组中对应的规则调为第一档规则；当第二类核心规则组中规则的规则分档标准值为第三档时，将第二类核心规则组中对应的规则调为第二档规则；当第二类核心规则组中规则的规则分档标准值为第一档第二档，且不为核心规则时，将第二类核心规则组中对应的规则调为第三档规则；为所述第一档规则、第二档规则和第三档规则赋予对应分值；步骤X7：根据步骤X6的规则分值调档结果在所述第二待分析数据集上对所述第二类核心规则组进行分值累积计算，根据计算结果得到第二类核心规则组对应的上报率；步骤X8：选择剩余核心规则组，重复执行步骤X7得到剩余核心规则组对应的上报率，选择上报率最高的核心规则组对专家模型进行优化；将所述分值型模型优化结果中得到的模型进行打包部署，完成对专家模型的优化。

全文数据：

权利要求：

百度查询：北京领雁科技股份有限公司一种基于机器学习分析规则的分值型模型优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

下一篇：一种采棉机摘锭座管测量装置_浙江亚嘉采棉机配件有限公司_202410465107.7

相关技术

一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

一种采棉机摘锭座管测量装置_浙江亚嘉采棉机配件有限公司_202410465107.7

一种低漏电流层积电容器的化成铝箔的处理工艺和层积电容器_肇庆绿宝石电子科技股份有限公司_202210484604.2

点云处理的方法、系统、电子设备及计算机可读存储介质_合众新能源汽车股份有限公司_202210573918.X

一种Invar合金焊丝及其制备、焊接方法_西安钢研功能材料股份有限公司_202311708375.9

一种车钩安装座高效焊接装置_南京海高德新技术有限公司_202311587530.6

制造时基于裕量退化的可靠性验收的半导体抽样测试方法_北京航空航天大学_202410458839.3

股骨头坏死植入支架_中国人民解放军联勤保障部队第九二〇医院_202410475083.3

一种露头岩层非均质性的模型构建方法_岭南师范学院_202310948270.4

用于铝基复合材料焊接的超声波预热激光焊接设备_恒超源洗净科技(深圳)有限公司_202410448442.6

厌氧水解联合短程硝化与短程反硝化厌氧氨氧化处理高氨氮养殖废水的装置与方法_北京工业大学_202310008181.1

基于零代词补齐的汉越数据增强方法_昆明理工大学_202210374347.7

型相关技术

V型夹具_卓佳公用工程(马鞍山)有限公司_202323058352.6

圆型织机_史太林格有限责任公司_202280075470.7

简易龙型玩具_汕头市澄海区鸿源盛玩具实业有限公司_202323182575.3

约束型管道结构_江苏恒竖管业有限公司_202410658182.5

音色清亮型古筝_扬州市红弦文化传媒有限公司_202322589773.5

防水型天花灯_中山市三强照明科技有限公司_202323284703.5

分型锁定装置_有限会社爱勇气技研_202280034350.2

密集型烘烤房_湖南省烟草公司株洲市公司_202322240537.2

透射型液晶衍射元件_富士胶片株式会社_202280075234.5

紧凑型功率模块_沃孚半导体公司_202280075158.8

值相关技术

生物值的预测方法_株式会社I-SENS_202280074922.X

一种基于涡流幅值的管材间隙值自动测量方法和装置_中核武汉核电运行技术股份有限公司_202211631669.1

值保无人机充电站_重庆嘉木机械有限公司_202323173811.5

触控笔压力值传输方法、电子设备及系统_荣耀终端有限公司_202310626965.0

直方图统计电路、亮度值统计方法及相关装置_维沃移动通信有限公司_202410322211.0

在处理单元处对值阵列执行运算_想象技术有限公司_202311759264.0

废旧电路板高值元件扫描切割装置_常州大学_201911230952.1

身体波频率和幅值独立可调的多关节机器海豚_东南大学_202410295865.9

一种估计基因组育种值的方法、装置及系统_深圳华优益生物技术有限公司_202110037193.8

长脉宽高幅值气动冲击和气候综合环境应力试验装置_中北大学_201810433949.9

规则相关技术

基于曼彻斯特编码规则的信号的解码方法_优艾特仪表科技成都有限公司_202410323438.7

一种不规则样品渗透率测试方法_东北石油大学_202210029844.3

定价规则配置方法、装置、设备及存储介质_中国建设银行股份有限公司_202410420423.2

基于规则挖掘的实例匹配方法_东南大学_202110320754.5

一种不规则挡墙的加固装置_中国建筑第二工程局有限公司_202322783115.X

一种基于过滤器的链式规则处理方法、装置及存储介质_上海浦东发展银行股份有限公司_202111321878.1

货车导航路线的交通规则分析方法、装置及电子设备_腾讯科技(深圳)有限公司_202410198109.4

一种基于协同过滤与关联规则的服装推荐方法_杭州览众数据科技有限公司_202010474194.4

集成图形化编程和规则引擎能力的业务决策管理系统_林俊_202310897483.9

一种融合领域推理规则的实体知识问答方法_中国电子科技集团公司第二十八研究所_202410420196.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于机器学习分析规则的分值型模型优化方法_北京领雁科技股份有限公司_202311822048.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务