首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于多组学数据的复发转移分析模型建立方法及系统_四川大学_202211198172.5 

申请/专利权人:四川大学

申请日:2022-09-29

公开(公告)日:2024-06-11

公开(公告)号:CN115565610B

主分类号:G16B40/00

分类号:G16B40/00;G16H50/30

优先权:

专利状态码:有效-授权

法律状态:2024.06.11#授权;2023.01.20#实质审查的生效;2023.01.03#公开

摘要:本发明提供了一种基于多组学数据的复发转移分析模型建立方法及系统。本发明的基于多组学数据的复发转移分析模型建立方法利用多组学数据信息,从多层次对复发转移的数据进行分析,使得对复发转移数据的分析更为全面有效,同时,通过对多组学数据进行系统化的组学特征数据的选择和降维处理,有效利用和筛选了不同组学的数据,对进行复发转移分析模型建立的多组学数据进行了质量控制,最终综合多种经典机器学习模型,提高了复发转移分析模型的准确性。

主权项:1.一种基于多组学数据的复发转移分析模型建立方法,其特征在于,包括以下步骤:S1、对来自不同组学的数据源进行归一化处理、比较分析,建立不同组间数据的关系,获取多组学数据,并对所述多组学数据中的组学特征数据进行提取;S2、利用主成分分析法对所述组学特征数据进行降维处理;S3、对降维处理后的所述组学特征数据进行数据增强,使得所述组学特征数据符合样本量要求;S4、基于符合样本量要求的所述组学特征数据,采用集成学习算法构建复发转移分析模型;所述复发转移分析模型表示为: 其中,Hx是集成分类器;c0为常数,cm是每个弱分类器的权值;m是弱分类器的指示标识,m=1,2,3;HmT是每个弱分类器的权重的同态积分;同态积分HmT表示为: 其中,T为迭代时间的阈值,xi为样本集中的第i个样本,αt表示弱分类器的权重,ht表示弱分类器; εt表示弱分类器的错误率: i为样本指示标识,n为样本个数,yi为样本i对应的复发转移标签;所述组学特征数据至少包括10组;所述S2中,所述主成分分析法具体为:TL=XWL其中,WL为将包含i个变量的原始组学数据X映射到数据集上包含i个不相关变量的新空间R,仅保留前L个主成分进行降维操作;所述S3具体为:S31、样本量的估计,计算每个选定的所述组学特征数据相对应于预设统计显著性的最佳样本量n,对所述组学特征数据进行数据扩充;所述最佳样本量n表示为: 其中,σ为标准差,μα和μβ是第一类错误率和第二类错误率下μ检验的临界值,Q1和Q2为经过二分类后的群体中各部分的比例,δ为两组数据均值的差值;S32、对所述组学特征数据扩充后的伪数据集进行评估,通过最大Fisher判别比F1验证生成的所述组学特征数据是否可以用于分类,并评估伪数据集数据增强的质量。

全文数据:

权利要求:

百度查询: 四川大学 基于多组学数据的复发转移分析模型建立方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。