首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于子特征选择的概念漂移检测与适应方法 

申请/专利权人:浙江工业大学

申请日:2024-03-13

公开(公告)日:2024-06-28

公开(公告)号:CN118260687A

主分类号:G06F18/2433

分类号:G06F18/2433;G06F18/211;G06F18/213;G06F40/30;G06N20/00

优先权:

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:本发明公开了一种基于子特征选择的概念漂移检测与适应方法,步骤如下:1收集数据形成数据集,构建基于集成分类器的分类预测模型、基于单类分类器的概念漂移检测器,初始化完成后二者开始并行工作;2使用概念漂移检测器进行概念漂移检测,当检测到异常数据点的比例大于警告阈值时,认为发生漂移,进行后续步骤并更新概念漂移检测器;3使用二分类器进行子特征漂移幅度检测,检测发生概念漂移的数据块中各个子特征的漂移幅度,作为集成分类预测模型的更新权重;4在检测到概念漂移之后,以各子特征的漂移幅度作为权重更新集成分类预测模型,并采用特征淘汰机制淘汰所有漂移幅度大于某一阈值且对分类器性能没有提升的子特征,完成集成分类预测模型的更新。本发明通过单类分类器在无监督的条件下进行概念漂移检测,在检测到漂移后对发生漂移的数据集中的各个子特征进行漂移幅度检测,从而找到在发生概念漂移前后分布变化最大的部分子特征,正是这些子特征的变化导致了概念漂移现象。

主权项:1.一种基于子特征选择的概念漂移检测与适应方法,其特征在于,包括以下步骤:步骤1:模型初始化:收集数据形成模型构建数据集Dtrain,构建基于集成分类器的分类预测模型、基于单类分类器的概念漂移检测器;初始化完成后,集成分类预测模型与概念漂移检测器开始并行工作,集成分类预测模型持续对数据流进行分类预测,概念漂移检测器持续检测数据流是否发生概念漂移;步骤2:概念漂移检测:数据流中到来的新数据被存储在滑动窗口Wstream中,通过概念漂移检测器推断其与Dtrain的相异性,即Wstream中的数据点被判断为与Dtrain不属于同一类别的比例;当Wstream已满且该比例大于警告阈值时,认为Wstream中的数据发生了概念漂移现象,发出概念漂移警告,依据实际应用语义决定继续还是暂停集成分类预测模型的分类预测,触发步骤3子特征漂移幅度检测,并使用Wstream中的数据作为Dtrain,重新构建概念漂移检测器,之后清空滑动窗口Wstream并采用重新构建的概念漂移检测器对后续数据继续进行概念漂移检测;当Wstream已满但该比例小于警告阈值,则认为未发生概念漂移,清空滑动窗口Wstream,对后续数据继续进行概念漂移检测;步骤3:子特征漂移幅度检测:使用二分类器进行子特征漂移幅度检测,通过将Dtrain的类标签设置为0,将Wstream中的数据点的类标签设置为1,对新、旧数据进行二分类;二分类器在全特征和每一个子特征上分别进行二分类,计算总体漂移幅度与各个子特征的漂移幅度,找出发生概念漂移前后分布变化大于总体分布变化的子特征,称之为显著子特征,之后,进行步骤4集成分类预测模型更新;步骤4:集成分类预测模型更新:在检测到概念漂移后,集成分类预测模型将向外界请求Wstream中的数据的类标签信息,并根据各个显著子特征的漂移幅度为其重新分配权重,使用加权的随机特征选取方法构建最优基分类器组合,最后采用特征淘汰机制淘汰所有漂移幅度大于某一阈值且对分类器性能没有提升的子特征,完成集成分类预测模型的更新,最后,恢复集成分类预测模型的分类预测工作。

全文数据:

权利要求:

百度查询: 浙江工业大学 一种基于子特征选择的概念漂移检测与适应方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。