恭喜上海斗象信息科技有限公司谢忱获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海斗象信息科技有限公司申请的专利模型训练方法及装置、数据清洗方法及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119782831B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510293490.7,技术领域涉及:G06F18/214;该发明授权模型训练方法及装置、数据清洗方法及电子设备是由谢忱;陈亮;徐钟豪设计研发完成,并于2025-03-13向国家知识产权局提交的专利申请。
本模型训练方法及装置、数据清洗方法及电子设备在说明书摘要公布了:本申请提供了一种模型训练方法及装置、数据清洗方法及电子设备,其中,模型训练方法包括:获取第一数据集;对第一数据集进行多尺度聚类处理,获得聚类数据集;对第一数据集进行异常检测,获得异常特征集;按照预设的多个特征类型分别对第一数据集进行多特征提取,获得每个特征类型对应的目标特征集;将聚类数据集、异常特征集以及各个目标特征集进行特征融合,获得增强特征集;应用增强特征集对集成模型进行训练,获得训练完成的集成模型。应用本申请提供的模型训练方法不仅可以得到精度更高的集成模块,应用该集成模型进行大规模的数据清洗时,还能提高数据清洗的效率。
本发明授权模型训练方法及装置、数据清洗方法及电子设备在权利要求书中公布了:1.一种模型训练方法,其特征在于,包括: 获取第一数据集,所述第一数据集为按照时间序列进行特征提取得到的流量数据集; 对所述第一数据集进行多尺度聚类处理,获得聚类数据集; 对所述第一数据集进行异常检测,获得异常特征集; 按照预设的多个特征类型分别对所述第一数据集进行多特征提取,获得每个所述特征类型对应的目标特征集; 将所述聚类数据集、所述异常特征集以及各个所述目标特征集进行特征融合,获得增强特征集; 应用所述增强特征集对集成模型进行训练,获得训练完成的集成模型;所述训练完成的集成模型用于对流量数据进行数据清洗; 其中,所述获取第一数据集,包括: 获取初始数据集; 按照时间序列对所述初始数据集进行时间对齐和分段处理; 对已对齐和分段处理后的所述初始数据集进行索引构建; 按照时间序列对已构建索引的所述初始数据集进行特征提取,获得第一数据集; 其中,所述按照时间序列对已构建索引的所述初始数据集进行特征提取,获得第一数据集,包括: 对已构建索引的所述初始数据集进行分解,得到第二数据集; 提取所述第二数据集在预设时间窗口内的统计量特征,获得第三数据集; 基于所述第三数据集的统计量特征,对所述第三数据集进行相关特征提取,得到相关特征集; 对所述相关特征集和或所述第二数据集进行时频特征提取,得到时频特征集,所述时频特征是用于表征时间-频率-尺度的三维特征; 对所述时频特征集和或所述第二数据集进行复杂度特征提取,获得复杂特征集,所述复杂度特征用于表征时间序列的不规则程度; 将所述复杂特征集和或所述时频特征集和或所述相关特征集进行特征融合,获得第一数据集;其中,所述特征融合包括特征拼接、特征加权和特征选择中的至少一种。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海斗象信息科技有限公司,其通讯地址为:201203 上海市浦东新区张衡路200号1号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。