买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:郑州大学第三附属医院(河南省妇幼保健院)
摘要:本发明涉及数据分析技术领域,具体公开了一种基于机器学习的宫颈癌病毒甲基化位点分析方法,本发明通过对HPV16病毒感染患者的病例样本进行分析,并获取患者的宫颈脱落细胞样本,对患者的宫颈脱落细胞样本内感染宫颈癌病毒的甲基化位点,进行甲基化水平分析,通过R语言的methylKitv1.18.0包筛出有临床意义的差异甲基化位点meth.diff25%且q0.05,再对高级别病变组及宫颈鳞状细胞癌组患者显著差异甲基化位点进行三三组合分析,通过机器学习回归模型结合ROC分析筛出敏感性及特异性最优的最佳组合位点。
主权项:1.一种基于机器学习的宫颈癌病毒甲基化位点分析方法,其特征在于,包括如下步骤:步骤一,样本准备:依据病理学及分子分型特征将HPV16病毒感染患者的病例样本,分类为第一正常对照组、第二高级别病变组以及第三宫颈鳞状细胞癌组,通过宫颈液基保存液分别获取患者的宫颈脱落细胞样本;步骤二,基因提取:利用凯普核酸提取仪HBNP-4801A,核酸提取试剂盒磁珠法DR-4801-KZ型提取宫颈脱落细胞样本中的基因组DNA;步骤三,捕获目标片段:通过液相探针杂交捕获法,捕获纳入分析的DNA样本中HPV16病毒的全基因组,并上机进行甲基化水平检测;步骤四,HPV16病毒全基因组甲基化水平分析:利用甲基化捕获测序原始数据使用FASTQ软件进行质控,在去除低质量和adaptor序列后使用bismarkv0.23.1软件内置的bowtie与HPV16基因组比对,使用bismark去除重复序列后,提取HPV胞嘧啶-磷酸-鸟嘌呤CpG甲基化位点的信息,使用mtoolsv1.15和mosdepthv0.3.2工具对bam文件进行质量评估,统计测序数据与基因组的比对概况和捕获效率;步骤五,差异甲基化位点筛选:使用methylKitv1.18.0读取甲基化文件后,进行差异分析,提取差异甲基化位点DMS和差异甲基化区域DMR,对比正常对照组,分析高级别病变组以及宫颈鳞状细胞癌组的甲基化位点差异水平,共有31个位点差异有统计学意义meth.diff25%且q0.05;步骤六:甲基化位点组合分析:将对比结果差异显著的31个甲基化位点,进行三三随机组合,共有969种组合形式,运用回归模型结合ROC分析和不同位点组合找最大组间差异的尝试,筛选出敏感性及特异性最优的最佳组合。
全文数据:
权利要求:
百度查询: 郑州大学第三附属医院(河南省妇幼保健院) 一种基于机器学习的宫颈癌病毒甲基化位点分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。