买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭银消费金融股份有限公司
摘要:本发明提供一种多分类模型预测分布调整方法,属于金融信息技术领域,具体包括:确定多分类模型的不同类别的样本的初始权重,并根据初始权重以及样本对多分类模型进行训练得到训练模型,获取不同类别的样本的历史逾期数据,并结合不同类别的预测分布结果的偏差情况进行不同类别的样本的初始权重的调整,直至训练模型在测试样本上的不同类别的预测分布情况满足要求,将需要进行权重调整的客群作为调整客群,并根据样本的信息相似情况以及预测分布结果的偏差情况将不同的调整客群划分至不同的调整客群群组,通过不同的调整客群群组的预测分布结果的偏差情况进行其对应的多分类模型的权重调整,保证了多分类模型的预测处理的准确性。
主权项:1.一种多分类风控模型预测分布调整方法,其特征在于,具体包括:确定多分类模型的不同类别的样本的初始权重,并根据所述初始权重以及样本对所述多分类模型进行训练得到训练模型;当所述训练模型在测试样本上的不同类别的预测分布结果不满足要求时,获取不同类别的样本的历史逾期数据,并结合不同类别的预测分布结果的偏差情况进行不同类别的样本的初始权重的调整,直至所述训练模型在测试样本上的不同类别的预测分布情况满足要求;通过不同类别的样本的信息相似情况将所述样本划分至不同的客群,并根据所述训练模型在不同客群的预测分布情况确定存在需要进行权重调整的客群时,进入下一步骤;将需要进行权重调整的客群作为调整客群,并根据样本的信息相似情况以及预测分布结果的偏差情况将不同的调整客群划分至不同的调整客群群组,通过不同的调整客群群组的预测分布结果的偏差情况进行其对应的多分类模型的权重调整;将所述样本划分至不同的客群,具体包括:根据不同样本的基础信用信息确定不同样本的基础信用信息的相似度,并根据基础信用信息的相似度进行不同样本之间的信息相似度;将信息相似度大于预设相似度阈值的样本划分至同一个客群;所述不同类别的样本的初始权重的调整的方法为:通过不同类别的样本的预测分布结果的偏差情况确定不同类别的样本的预测结果准确率;根据不同类别的样本的历史逾期数据进行不同类别的样本的逾期样本的数量以及数量占比的确定,并结合不同类别的逾期样本的逾期时长确定不同类别的样本的权重调整因子;根据所述预测结果准确率以及权重调整因子进行不同类别的调节因子的确定,并利用所述调节因子对不同类别的样本的初始权重进行调整;将不同的调整客群划分至不同的调整客群群组,具体包括:根据不同的调整客群在不同类别的样本之间的信息相似情况确定不同的调整客群在不同类别的样本的信用信息相似度,并判断调整客群之间的信用信息相似度不满足要求的类别的数量是否满足要求,若是,则进入下一步骤,若否,则确定所述调整客群不属于同一个调整客群群组;根据不同的调整客群在不同类别的预测分布结果与目标分布结果的偏差情况确定不同的调整客群在不同类别的预测偏差相似度,并判断调整客群之间的预测偏差相似度不满足要求的类别的数量是否满足要求,若是,则进入下一步骤,若否,则确定所述调整客群不属于同一个调整客群群组;基于在不同类别的预测偏差相似度以及信用信息相似度确定不同的调整客群在不同类别的综合相似度,判断调整客群之间的综合相似度不满足要求的类别的数量是否满足要求,若是,则进入下一步骤,若否,则确定所述调整客群不属于同一个调整客群群组;根据在不同类别的综合相似度以及不同类别的样本数量进行不同的调整客群之间的相似度评估量,并利用所述相似度评估量将不同的调整客群划分至不同的调整客群群组。
全文数据:
权利要求:
百度查询: 杭银消费金融股份有限公司 一种多分类模型预测分布调整方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。