首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种在WES数据中检测单样本SMN基因拷贝数的方法_赛福解码(北京)基因科技有限公司_202011107940.2 

申请/专利权人:赛福解码(北京)基因科技有限公司

申请日:2020-10-16

公开(公告)日:2024-05-03

公开(公告)号:CN112435710B

主分类号:G16B20/10

分类号:G16B20/10

优先权:

专利状态码:有效-授权

法律状态:2024.05.03#授权;2021.03.19#实质审查的生效;2021.03.02#公开

摘要:本发明公开了一种在WES数据中检测单样本SMN基因拷贝数的方法,通过预先使用已知SMN基因实际拷贝数的阴性样本和已知SMN基因实际拷贝数的阳性样本构建SMN1基因和SMN2基因拷贝数分值数据集来检测单个样本的基因拷贝数,通过在全外显子Bed区间内寻找与SMN基因拷贝数高相关性的对照区间;利用该区域的reads覆盖度校正不同样本间的批次效应,有效提升了检测方法的准确性,同时还可以检测出发生了g.27134TG点突变的SMN12+0静默携带者。实现了精确检测单样本SMN基因拷贝数且检测出发生了g.27134TG点突变的SMN12+0静默携带者的目的。

主权项:1.一种在WES数据中检测单样本SMN基因拷贝数的方法,其特征在于:S1、收集不同批次WES数据的已知SMN基因实际拷贝数的阴性样本和已知SMN基因实际拷贝数的阳性样本,在全外显子Bed区间内寻找与SMN基因拷贝数高相关性的对照区间;其中,所述S1中寻找所述对照区间具体包括如下步骤:S101、用MLPA平台验证所述所有样本的SMN1基因和SMN2基因的实际拷贝数,使用生信分析流程进行处理后得到Bam文件;S102、预先筛选出两拷贝基因的Bed区间,统计所述所有样本在全外显子组的Bed区间内的覆盖度;S103、把所述所有样本的覆盖度校正到100X,得到样本校正后覆盖度;S104、根据所述所有样本校正后覆盖度计算相关性和方差,查找相关性好且方差值低的前5个Bed区间作为对照区间;S2、利用所述对照区间的resds覆盖度校正所述阴性样本和阳性样本间的批次效应,定义所述不同批次WES数据的已知SMN基因实际拷贝数的阴性样本和已知SMN基因实际拷贝数的阳性样本为所有样本,计算所述所有样本的SMN1基因的相应拷贝数时的P1值分布范围和SMN2基因的相应拷贝数时的P2值分布范围;统计所述所有样本中已经验证为是静默携带者的样本的7号内含子的g.27134TG位点的校正后覆盖度P_silent值分布范围;其中,所述S2具体包括如下步骤:S201、统计所述所有样本在SMN1基因和SMN2基因的7号外显子和8号外显子的总覆盖度并校正,得到SMN1基因和SMN2基因7号外显子和8号外显子的校正后总覆盖度;S202、统计所述所有样本在5个所述对照区间的总覆盖度并校正,得到对照区间的校正覆盖度均值;S203、统计所述所有样本的3个点突变的覆盖度并校正,得到3个点突变的校正后覆盖度;所述3个点突变的覆盖度包括7号外显子上的c.840CT位点的覆盖度、8号外显子上的c.*239GA位点的覆盖度和7号内含子上的g.27134TG位点的覆盖度;计算SMN1基因的校正后覆盖度在7号外显子、8号外显子的ratio值;计算SMN2基因的的校正后覆盖度在7号外显子、8号外显子的ratio值;S204、根据所述SMN1基因和SMN2基因的7号外显子和8号外显子的校正后总覆盖度、对照区间的校正覆盖度均值、所述ratio值,计算SMN1基因的7号外显子的拷贝数p_e7_s1值和8号外显子的拷贝数p_e8_s1值;计算SMN2基因的7号外显子的拷贝数p_e7_s2值和8号外显子的拷贝数p_e8_s2值;根据p_e7_s1值和p_e8_s1值计算p1值;根据p_e7_s2值和p_e8_s2值计算p2值;所述所有样本根据相应拷贝数统计的p1值的分布范围为P1,所述所有样本根据相应拷贝数统计的p2值的分布范围为P2;S3、计算单个测试样本的SMN1基因的7号外显子和8号外显子的p1值、SMN2基因的7号外显子和8号外显子的p2值,根据S2中计算所得的P1值和P2值的分布范围判断本步骤中p1值和p2值所对应的SMN1基因和SMN2基因的拷贝数;统计单个测试样本的7号内含子上的g.27134TG位点的覆盖度p_silent值;根据所述p_silent值和所述单个测试样本的SMN1基因的拷贝数,判断该单个测试样本静默携带者的状态:当p_silent值在S2中计算的P_silent值分布范围内且所述单个测试样本的SMN1基因的拷贝数是2时,判断所述单个测试样本为静默携带者;当p_silent值在S2中计算的P_silent值分布范围内但所述单个测试样本的SMN1基因的拷贝数不是2,判断所述单个测试样本为疑似静默携带者;其他情况时均判断所述单个测试样本为非静默携带者。

全文数据:

权利要求:

百度查询: 赛福解码(北京)基因科技有限公司 一种在WES数据中检测单样本SMN基因拷贝数的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。