首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于基因表达预测FIGO IIIC期浆液性卵巢癌预后的方法_复旦大学_201711175316.4 

申请/专利权人:复旦大学

申请日:2017-11-22

公开(公告)日:2018-02-27

公开(公告)号:CN107742062A

主分类号:G06F19/20(2011.01)I

分类号:G06F19/20(2011.01)I;G16H50/30(2018.01)I

优先权:

专利状态码:失效-发明专利申请公布后的视为撤回

法律状态:2020.09.22#发明专利申请公布后的视为撤回;2018.07.06#实质审查的生效;2018.02.27#公开

摘要:本发明属于医学分子生物学技术领域,具体为一种基于基因表达预测FIGO IIIC期浆液性卵巢癌预后的方法。本发明方法包括如下步骤:提取病人组织样本中的mRNA,对其中的靶基因进行定量,并对所获取的基因进行去背景和归一化处理;对样本所在样本集进行z‑score转化,得到初始靶基因表达相对量;根据所描写的方程和方程中所测的靶基因的相对表达量,计算风险系数;并根据阈值判断病人术后的危险程度。本方法具有稳健性强,检测速度快,不依赖于已有临床指标和治疗药物的特点。通过本方法可为病人的预后,随访和治疗提供指导。

主权项:一种基于基因表达预测FIGO IIIC期浆液性卵巢癌预后的方法,其特征在于,具体步骤为:(1)对病人术后新鲜或冷冻组织样本抽提RNA,然后对所需的七个靶基因进行定量分析;这里,所述七个靶基因,是从表达谱20000多个基因中优化组合选择出的,具体为IL2RG,CXCL9,TSPAN13,CXCL13,GADD45G,RAB36和CD3D;(2)再通过对应的去背景和标准化的方法对数据进行进一步处理,随后用z‑score转化的方法计算样本在样本集中的相对分布位置;(3)根据下述风险预测模型,预测该病人的风险系数:风险系数值=0.1074*CD3D+‑0.2262*RAB36 +‑0.1740*GADD45G+‑0.1017*CXCL13 + ‑0.1197*TSPAN13+‑0.1933*CXCL9+‑0.0706*IL2RG;     (1)这里,CD3D,RAB36,GADD45G,CXCL13,TSPAN13,CXCL9,IL2RG 7个因子代表该基因的相对表达量;系数是通过Cox多因素回归的方法拟合TCGA数据集中这几个基因的表达数值和总体生存情况得到。

全文数据:基于基因表达预测FIGOII1C期浆液性卵巢癌预后的方法技术领域[0001]本发明属于医学分子生物学技术领域,具体涉及多基因表达定量对预后的指导作用的处理方法,包括基因芯片技术,二代测序技术和实时定量PCR技术对卵巢癌预后的模型。背景技术[0002]目前,FIGOIIIC期浆液性卵巢癌用于临床的预后指标主要以传统临床病理特征为基础,依赖手术和治疗方式。其中包括病人的病理分级,年龄等信息参见:BristowRE,ZahurakML,AlexanderCJ,etal.FIGOstageIIICendometrialcarcinoma:resectionofmacroscopicnodaldiseaseandotherdeterminantsofsurvival[J].InternationalJournalofGynecologicalCancer,2003,135:664-672.。临床信息能够反映出癌症的进展,却不能反映癌症本身的异质性,因而无法给出全面的预测效果参见:BakkarR,GershensonD,FoxP,etal.StageIIICovarianperitonealserouscarcinoma:aheterogeneousgroupofpatientswithdifferentprognoses.[J].InternationalJournalofGynecologicalPathologyOfficialJournaloftheInternationalSocietyofGynecologicalPathologists,2014,333:302-8.。单分子标记物用于FIGOIIIC期浆液性卵巢癌预后也有模型被开发出来(参见:C〇rneyDC,NikitinAY.MicroRNAandovariancancer[J].Histologyandhistopathology,2008,239:1161.,然而这种模型一般可靠性较差,在来自不同中心和机构的样本中表现查一下较大。针对高分化的浆液性卵巢癌的模型目前己有发现(参见:BerChuCkA,IversenES,LancasterJM,etal.Patternsofgeneexpressionthatcharacterizelong-termsurvivalinadvancedstageserousovariancancers[J].Clinicalcancerresearch,2005,1110:3686-3696.,但是针对FIGOIIIC期的模型目前尚未报道。发明内容[0003]本发明旨在克服临床实践中针对FIGOIIIC期浆液性卵巢癌预后因子的不稳定性,提出一种操作简单、效率高、适用范围广的基于基因表达预测FIGOIIIC期浆液性卵巢癌预后的方法,包括筛选和优化基因表达信息,构建预后模型,以便对FIGOIIIC期浆液性卵巢癌预后提供有效的指导,帮助制定随访和治疗方案。[0004]本发明提出的基于基因表达预测FIGOIIIC期浆液性卵巢癌预后的方法,具体步骤为:1对病人术后新鲜或冷冻组织样本抽提RNA,然后对所需的七个靶基因进行定量分析;这里,所属定量分析方法,可以使用当前市场上标准化的芯片表达定量方法,RNA测序方法或者QPCR定量方法;所述七个靶基因,是本发明从表达谱20000多个基因中优化组合选择出的,具体为IL2RG,CXCL9,TSPAN13,CXCL13,GADD45G,RAB36和CD3D;2再通过对应的去背景和标准化的方法对数据进行进一步处理,随后用z-score转化的方法计算样本在样本集中的相对分布位置;这里,所述去背景是指根据已知的方法对芯片的噪声进行评估,所述标准化是指根据表达谱的固有特征去除样本之间的系统误差和批次效应,使用的方法是对数处理的稳健多芯片分析法(logscalerobustmulti-arrayanalysis,简称RMA;z-score转化的方法计算样本在样本集中的相对分布位置,即为基因A在某个样本的相对表达值-基因A在样本集中表达值的平均数基因A在样本集中的标准差;3根据下述风险预测模型,预测该病人的风险系数:风险系数值=〇•l〇74*CD3D+-0•2262*RAB36+-0•1740*GADD45G+-0•1017*CXCL13+-0.1197*TSPAN13+-0.1933*CXCL9+-0.0706*IL2RG1。[0005]在本步骤中,0〇3〇,1^836,6厶00456,00^3,丁3卩六町3,0父卬9,几21^,7个因子代表该基因的相对表达量;系数是通过Cox多因素回归的方法拟合TCGA数据集中这几个基因的表达数值和总体生存情况得到。风险系数值计算方程式即是预后模型。[0006]在本发明中,如风险系数大于样本集风险系数平中位数的病人样本的,判断为高危组,如风险系数小于样本集危险系数中位数的病人样本的,判断为低危组。在实际操作中,也可按照风险系数为正或者负值判断属于哪一组,即风险系数为正,判断为高危组,风险系数为负,判断为低危组。[0007]本发明中,步骤(1中对基因的定量分析包括RNA测序技术和基因表达芯片技术等。作为优选,可通过反转录荧光定量聚合酶链式反应qRT-PCR技术对组织样本进行定量。[000S]本发明中,步骤(2采用标准化方法对数据进行进一步处理,也可用其他方法处理,如不经标准化处理直接按照方程式1计算危险系数。[0009]相对于其他技术,本发明的优点在于:将临床上使用最多的FIGOIIIC期浆液性卵巢癌作为考虑的出发点,所涉及的方法易于实现,操作简单,所需时间短,效率高,应用范围广。本方法旨在考虑卵巢癌在发生和发展中的多态性,为后续的随访和治疗提供参考。附图说明[0010]图1为根据所计算的风险值,高危组和低危组两组病人的生存曲线图。其中,灰线代表高危组,黑线代表低危组,十字标注的部位为截尾数据。[0011]图2为根据所计算的风险值,高危组和低危组两组病人的无病生存曲线图。其中,灰线代表高危组,黑线代表低危组,十字标注的部位为截尾数据。、[0012]图3为三年生存R0C曲线。[0013]图4为依据数据集GSE32〇62的生存曲线图。其中,灰线代表高危组,黑线代表低危组;十字标注的部位为截尾数据。[00M]图5为依据数据集GSE63885的生存曲线图。其中,灰线代表高危组,黑线代表低危组;十字标注的部位为截尾数据。^[0015]图6为箱式图,纵坐标代表风险系数,横坐标是各个临床指标。[0016]图7为Cox对因素回归对应的临床指标和风险系数的p值和风险比。横坐标是风险比,点代表对应的指标的风险比,线为风险比的95%置信区间。[0017]图8为实施例中高危险和低危险组的生存差异。其中,灰线代表高危组,黑线代表低危组;十字标注的部位为截尾数据。具体实施方式[0018]本发明使用公共数据集:E-MTAB386https:www•ebi•ac•ukarrayexpressexperimentsE-MTAB-386为例,对该发明的使用方法进行举例。首先对原始数据进行RMA标准化处理,再将所选的7个基因进行z-score的转化。根据上述算式,计算每个样本的风险系数。随后将样本根据风险系数的中位数分为高危险和低危险组,对比二者之间的生存差异。如图8所示。[0019]根据所计算出的风险值,将来自TCGA数据集的病人进行了分类,分为高危和低危病人组,对两组的病人的总体生存情况进行了分析。结果显示按照上述算式低危险组病人的生存情况显著优于低危险组病人。参见图1所示,此图为生存曲线图,横坐标代表生存时间,纵坐标代表总体生存率,红线代表高危险组,蓝线代表低危险组。十字标注的部位为截尾数据。[0020]除此之外,对病人无复发生存进行了分析,发现低危组病人的无复发生存情况显著长于高危病人的无复发生存时间,如图2所示,此图为无病生存曲线图,横坐标代表无病生存时间,纵坐标代表总体生存率,红线代表高危险组,蓝线代表低危险组。十字标注的部位为截尾数据。[0021]通过分析分化,年龄和肿瘤大小等因素,对比各个因素对三年生存期的贡献,发现风险值受试者三年生存曲线下面积显著高于其他临床指标。如图3所示,此图为三年生存R0C曲线(receivingoperatingcharacteristiccurve。横坐标为特异性,纵坐标是敏感性,AUC代表曲线下面积AreaUnderCuurve,AUC,用于评估指标的表现,AUC越大,效果越好。四种曲线分别代表四种指标的R0C分布及AUC数值。[0022]为进一步确定本发明的稳定性,我们筛选了来自于数个国家中心的2个样本集验证。通过同样的计算方程,将每组的病人分为高低危组,对比两组之间的生存差异,如图4数据集GSE32〇62、图5GSE638S5、所示。此图为生存曲线图,横坐标代表生存时间,纵坐标代表总体生存率,红线代表高危险组,蓝线代表低危险组。十字标注的部位为截尾数据。[0023]除此之外,本指标和其他指标淋巴侵袭,治疗效果,年龄,性别,分级等无关,且对三年生存的贡献最大,如下图6、图7所示。图6横坐标代表各个临床指标,纵坐标为风险系数,表现为箱式图。图7为Cox多因素回归结果,横坐标是风险比,红色点代表所列指标的风险比,直线代表风险比的95%置信区间。[0024]图8为具体实施例。此图为生存曲线图,横坐标代表生存时间,纵坐标代表总体生存率,红线代表高危险组,蓝线代表低危险组。十字标注的部位为截尾数据。[0025]本指标的预测效果和治疗所应用药物无关。

权利要求:1.一种基于基因表达预测FIGOII1C期浆液性卵巢癌预后的方法,其特征在于,具体步骤为:1对病人术后新鲜或冷冻组织样本抽提RNA,然后对所需的七个靶基因进行定量分析;这里,所述七个靶基因,是从表达谱2〇〇〇〇多个基因中优化组合选择出的,具体为IL2RG,CXCL9,TSPAN13,CXCL13,GADD45G,RAB36和CD3D;2再通过对应的去背景和标准化的方法对数据进行进一步处理,随后用z-score转化的方法计算样本在样本集中的相对分布位置;3根据下述风险预测模型,预测该病人的风险系数:风险系数值=〇•l〇74*CD3D+-0•2262*RAB36+-0.1740*GADD45G+-0.1017*CXCL13+-0.1197*TSPAN13+-0.1933*CXCL9+-0.0706*IL2RG;1这里,CD3D,RAB36,GADD45G,CXCL13,TSPAN13,CXCL9,IL2RG7个因子代表该基因的相对表达量;系数是通过Cox多因素回归的方法拟合TCGA数据集中这几个基因的表达数值和总体生存情况得到。2.根据权利要求1所述的方法,其特征在于,风险系数大于样本集风险系数平中位数的病人样本的,判断为高危组,风险系数小于样本集危险系数中位数的病人样本的,判断为低危组;或者,风险系数为正,判断为高危组,风险系数为负,判断为低危组。

百度查询: 复旦大学 基于基因表达预测FIGO IIIC期浆液性卵巢癌预后的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。