买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:湖北中烟工业有限责任公司
摘要:本申请公开了一种二分类不平衡数据集的平衡处理方法、装置、设备及介质,涉及数据处理技术领域,包括获取工业生产活动中存在二分类不平衡问题的数据集,对数据集进行数据点划分及异常点筛选;将单面选择欠采样方法和BorderlineSMOTE过采样方法结合,构建单面选择欠采样‑BorderlineSMOTE混合采样算法模型,对单面选择欠采样‑BorderlineSMOTE混合采样算法模型训练及测试;利用目标单面选择欠采样‑BorderlineSMOTE混合采样算法模型对待处理数据集中的二分类不平衡问题进行平衡处理。本申请能够提高对二分类不平衡数据集进行平衡处理的准确性和质量,有效提高数据平衡性。
主权项:1.一种二分类不平衡数据集的平衡处理方法,其特征在于,包括:获取工业生产活动中存在二分类不平衡问题的数据集,基于密度的聚类算法对所述数据集进行数据点划分及异常点筛选,以得到划分筛选后的所述数据集;将单面选择欠采样方法和BorderlineSMOTE过采样方法结合,以构建单面选择欠采样-BorderlineSMOTE混合采样算法模型,利用划分筛选后的所述数据集对所述单面选择欠采样-BorderlineSMOTE混合采样算法模型进行训练及测试,以得到目标单面选择欠采样-BorderlineSMOTE混合采样算法模型;将存在二分类不平衡问题的待处理数据集输入至所述目标单面选择欠采样-BorderlineSMOTE混合采样算法模型,以便利用所述目标单面选择欠采样-BorderlineSMOTE混合采样算法模型对所述待处理数据集中的二分类不平衡问题进行平衡处理。
全文数据:
权利要求:
百度查询: 湖北中烟工业有限责任公司 二分类不平衡数据集的平衡处理方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。