首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度学习的大数据特征析取方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南麓川信息科技有限公司

摘要:本发明提供一种基于深度学习的大数据特征析取方法及系统,属于数据处理技术领域,包括以下步骤:S1:获取原始数据,采用大数据预处理算法对原始数据进行预处理;S2:利用深度学习模型获取原始数据的数据特征,对数据特征进行相关性评估分析,得到评估分析结果;S3:再对评估分析结果进行处理,得到特征子集;S4:收集不同来源、不同类型的数据特征的特征子集,并对特征子集进行降维分析处理,以生成降维分析结果。本发明通过使用广义特征值问题进行降维分析处理,提高降维后数据的可分辨性和保持数据结构的能力,同时引入类内散度矩阵和类间散度矩阵的考虑,有助于更好地理解数据特征之间的类别差异和聚类结构。

主权项:1.一种基于深度学习的大数据特征析取方法,其特征在于,包括以下步骤:S1:获取原始数据,采用大数据预处理算法对原始数据进行预处理;S2:利用深度学习模型获取原始数据的数据特征,对数据特征进行相关性评估分析,得到评估分析结果;评估分析的具体步骤为:S21:选取数据特征中的任一特征作为起始特征,将剩余特征作为评估特征,对起始特征、评估特征分别进行编号;S22:使用相关性系数来度量起始特征和评估特征之间的综合相关系数、互信息;设定特征权重矩阵并将其中任一元素表示为w(i,p),w(i,p)表示起始特征与评估特征之间的权重;i表示起始特征的编号,p表示评估特征的编号;对综合相关系数、互信息进行加权处理,先将综合相关系数、互信息进行乘积计算,并与相应的权重相乘,得到评估特征对于起始特征的联系相关值;S23:对每个起始特征所对应评估特征的联系相关值进行降序排序,得到联系相关列表,将联系相关列表中相邻的联系相关值进行差值计算的邻互差值;设定邻互差值所对应的正常阈值,若邻互差值大于其正常阈值,则联系相关列表中在邻互差值位置以上的联系相关值所对应的评估特征标记为似乎有关特征,并记录似乎有关特征数量FG1;设定联系相关列表中评估特征的常规选取数量FG2;按照联系相关值的降序顺序对所有的邻互差值方差计算得到关联波动值FG3;将似乎有关特征数量、常规选取数量、关联波动值标记为评估分析结果;S3:再对评估分析结果进行处理,利用公式,得到关联选取数FG并取整数值;其中,g1、g2、g3分别表示似乎有关特征数量、常规选取数量、关联波动值所对应的权重;按照关联选取数由降序选取联系相关列表中的评估特征作为关联特征,由起始特征与其对应所有的关联特征标记为子集特征,由所有的起始特征所对应的子集特征构成特征子集;S4:收集不同来源、不同类型的数据特征的特征子集,并对特征子集进行降维分析处理,以生成降维分析结果;降维分析结果包括新的特征子空间矩阵、降维后的数据矩阵、特征子集的类内散度矩阵和类间散度矩阵;S5:对降维分析结果进行可视化展示。

全文数据:

权利要求:

百度查询: 湖南麓川信息科技有限公司 一种基于深度学习的大数据特征析取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。