首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于栈式自编码器的数据融合优化方法及其系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安徽大学

摘要:本发明公开了一种基于栈式自编码器的数据融合优化方法,包括以下步骤:S1:利用栈式自编码器对获取的癌症患者多组学数据进行降维,得到能够代表原始数据的低维潜在表示;S2:利用步骤S1得到的降维之后的组学数据,基于径向基函数和利用欧氏距离度量样本之间的亲密程度,计算出相似矩阵;S3:为每个组学数据定义相对相似矩阵,利用归一化因子控制样本的密度;S4:对融合得到的平均相对相似矩阵进行谱聚类,从而对癌症患者进行亚型划分。还公开了一种基于栈式自编码器的数据融合优化系统。本发明能够对高维度、多噪声的组学数据进行降维和融合,准确有效地对癌症进行亚型聚类,能有效提升癌症亚型聚类效果。

主权项:1.一种基于栈式自编码器的数据融合优化方法,其特征在于,包括以下步骤:S1:利用栈式自编码器对获取的癌症患者多组学数据进行降维,得到能够代表原始数据的低维潜在表示;所述栈式自编码器由若干个稀疏自编码器组成,所述稀疏自编码器由自编码器通过导入KL离散度来衡量某个隐藏层节点的平均激活输出与稀疏度之间的相似性,用来实现数据的稀疏降维,所述自编码器包括输入层、隐藏层和输出层;具体步骤包括:S101:根据获取的癌症患者多组学数据的维度分别设定输入层、隐藏层和输出层的神经元节点个数,设定所述输入层与所述隐藏层的第一连接权向量矩阵,设定所述隐藏层和所述输出层的第二连接权向量矩阵,设定所述栈式自编码器模型的损失函数;S102:获取癌症数据集的组学数据特征输入到稀疏自编码中进行迭代训练,直到所述损失函数达到收敛,得到所述隐藏层的每个神经元的加权输出值,作为一个新的稀疏自编码器的所述输入层的输入数据,并保存所述稀疏自编码器模型的权重作为所述栈式自编码器的第一连接权向量矩阵;S103:执行步骤S102三次,第三个稀疏自编码器所述隐藏层的每个神经元的加权输出值,即所述栈式自编码器的最终输出数据;S2:利用步骤S1得到的降维之后的组学数据,基于径向基函数和利用欧氏距离度量样本之间的亲密程度,计算出相似矩阵;所述相似矩阵的计算公式为: 其中定义为: 假设有n个受试者,包含有L类组学数据,Xl代表组学数据l的数据矩阵,Xl的大小是pl×n,pl是组学数据l的特征数量;把xli当作组学数据l里样本i的特征,也就是Xl的第i列;设ξli表示组学数据l中样本i的k个最近邻样本,是一个归一化因子,它通过平均第i个和第j个样本到其最近的邻居的平方距离和这两个样本之间的平方距离来控制样本的密度;S3:为每个组学数据定义相对相似矩阵,利用归一化因子控制样本的密度;具体步骤包括:S301:为每个组学数据l定义相对相似矩阵RMl: 其中I为指标函数,RMli,j为相对相似性矩阵,它的第一项为一个组学数据中样本i和j之间距离相对于i的k个欧氏距离最小的样本比值,第二项其相对于j的k个欧氏距离最小的样本比值;S302:计算维度大小为n×n平均相对相似矩阵ARM,其表达式为: RMl是定义了一个样本之间的转移概率,即样本相互间的转移概率与样本相互间的相似度是以正比函数关系存在的;S4:对融合得到的平均相对相似矩阵进行谱聚类,从而对癌症患者进行亚型划分。

全文数据:

权利要求:

百度查询: 安徽大学 基于栈式自编码器的数据融合优化方法及其系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。