首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】用于识别对预测器具有不利影响的数据漂移的方法和装置_国际商业机器公司_202010322807.2 

申请/专利权人:国际商业机器公司

申请日:2020-04-22

公开(公告)日:2024-06-18

公开(公告)号:CN111860861B

主分类号:G06N20/00

分类号:G06N20/00;G06F18/23;G06F18/214

优先权:["20190428 US 16/396716"]

专利状态码:有效-授权

法律状态:2024.06.18#授权;2020.11.17#实质审查的生效;2020.10.30#公开

摘要:本发明涉及一种用于识别对预测器具有不利影响的数据漂移的方法和装置。所述方法包括:获得在特征空间中的实例的基线数据集,每个实例与标签相关联;基于基线数据集,在特征空间中确定一组集群;基于基线数据集,确定在一组集群上的实例的基线分布;针对每个集群,计算每个集群的预测器的性能度量,预测器被配置为估计实例的估计标签,性能度量指示预测器对集群所包括的基线数据集的一部分的成功估计;获得第二数据集,第二数据集包括在特征空间中的实例;确定在一组集群上的实例的第二分布,所述确定第二分布是基于第二数据集;基于第二分布和基线分布,并且基于一组集群中的至少一个集群的性能度量,识别第二数据集相对于基线数据集的数据漂移。

主权项:1.一种方法,包括:获得基线数据集,其中,所述基线数据集包括第一组实例,每个实例包括在特征空间中的特征值,其中,所述第一组实例中的每个实例与标签相关联;基于所述第一组实例的所述特征值,在所述特征空间中确定一组集群;确定在所述一组集群上的实例的基线分布,其中,所述确定所述基线分布是基于所述基线数据集;针对每个集群,计算所述每个集群的预测器的性能度量,其中,所述预测器被配置为估计实例的估计标签,其中,所述性能度量指示所述预测器对所述每个集群所包括的所述第一组实例的一部分的成功估计;获得第二数据集,其中,所述第二数据集包括第二组实例,其中,每个所述实例包括在所述特征空间中的特征值;确定在所述一组集群上的实例的第二分布,其中,所述确定所述第二分布是基于所述第二数据集;基于所述第二分布和所述基线分布,并且基于所述一组集群中的至少一个集群的至少一个性能度量,识别所述第二数据集相对于所述基线数据集的数据漂移,其中所述数据漂移是数据分布相对于所述基线数据集的变化,所述获得所述第二数据集是使用硬件设备执行的;以及响应于识别所述数据漂移,替换所述硬件设备。

全文数据:

权利要求:

百度查询: 国际商业机器公司 用于识别对预测器具有不利影响的数据漂移的方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术