恭喜山东财经大学胡立彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜山东财经大学申请的专利基于先验置信与异质共识策略的噪声标签识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119026032B 。
龙图腾网通过国家知识产权局官网在2025-03-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411523294.6,技术领域涉及:G06F18/243;该发明授权基于先验置信与异质共识策略的噪声标签识别方法及系统是由胡立彬;张云峰;刘培德设计研发完成,并于2024-10-30向国家知识产权局提交的专利申请。
本基于先验置信与异质共识策略的噪声标签识别方法及系统在说明书摘要公布了:本发明公开一种基于先验置信与异质共识策略的噪声标签识别方法及系统,涉及人工智能及不平衡分类技术领域,包括:获取若干已标注标签的样本数据,构建原始数据集;利用二分类模型获取原始数据集中每一样本数据的梯度贡献;以类别不平衡为先验条件,以梯度贡献作为标注标签的置信度度量指标,采用先验置信策略,识别原始数据集中的噪声标签样本,构建噪声数据集;去除原始数据集中的噪声数据集,利用干净数据集训练异质分类器;利用异质分类器对噪声数据集中每一样本数据进行伪标签预测,基于伪标签和预设概率共识阈值,采用异质共识策略筛选出噪声数据集中潜在的伪少数类样本数据。本发明可实现类别不平衡条件下准确的噪声标签识别。
本发明授权基于先验置信与异质共识策略的噪声标签识别方法及系统在权利要求书中公布了:1.一种基于先验置信与异质共识策略的噪声标签识别方法,其特征在于,包括:获取若干已标注标签的样本数据,构建原始数据集;根据标签数量将原始数据集中的样本数据划分为多数类样本和少数类样本;其中,所述样本数据为已标注正常消费和欺诈消费的信用卡消费记录数据,以此构建原始的信用卡消费记录数据集,原始数据集中正常消费样本的标签为0,欺诈消费样本的标签为1,划分正常消费样本为多数类样本,划分欺诈消费样本为少数类样本;或所述样本数据为已标注正常还款和还款违约的信用贷款数据,以此构建原始的信用贷款数据集,原始数据集中正常还款样本的标签为0,还款违约样本的标签为1,划分正常还款样本为多数类样本,划分还款违约样本为少数类样本;利用基于交叉验证的二分类模型,计算原始数据集中每一样本数据的梯度贡献,具体为:将原始数据集中的每一样本数据输入至基于交叉验证的二分类模型中,输出每一样本数据预测为少数类样本的概率;所述二分类是指预测已标注标签的样本数据为多数类样本或少数类样本;根据预测为少数类样本的概率,计算确定二分类的交叉熵损失;将交叉熵损失对预测为少数类样本的概率的导数,作为样本数据的梯度贡献;以类别不平衡为先验条件,以样本数据的梯度贡献作为标注标签的置信度度量指标,采用先验置信策略,识别原始数据集中的噪声标签样本,构建噪声数据集;获取原始数据集中去除噪声数据集的干净数据集,利用干净数据集训练异质分类器,所述训练异质分类器具体为:利用干净数据集训练两种异质分类器,即多层感知机MLP和K最近邻模型KNN;利用训练完成的两种异质分类器分别预测的噪声数据集中每一样本数据的伪标签,获取对应的预测概率;利用异质分类器对噪声数据集中每一样本数据进行伪标签预测,基于伪标签和预设概率共识阈值,采用异质共识策略筛选出噪声数据集中潜在的伪少数类样本数据;整合干净数据集和伪少数类数据集,得到最终标签标注正确的数据集,利用该数据集进行对应模型训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东财经大学,其通讯地址为:250000 山东省济南市历下区二环东路7366号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。