买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广州燃石医学检验所有限公司
摘要:本公开涉及使用高通量测序数据检测基因组区域中的结构变异包括缺失、重复、倒位和易位的方法。本公开还提供了用于检测基因组区域中的结构变异的系统、设备和计算机可读介质。
主权项:1.检测基因组区域中的结构变异SV的方法,所述方法包括:a.读取高通量测序数据的序列比对文件,i将含有soft-clipping的读长作为SRSplit-read信号进入SR信号分析流程;和或ii将在参考基因组中的回贴方向不是正向-反向的读长对,以及在参考基因组中回贴方向是正向-反向但具有异常插入片段长度insertsize的读长对作为PEPaired-end信号进入PE信号分析流程;b.将进入SR信号分析流程的读长根据QNAME分组,并在每个组中根据读长的FLAG值进行主要回贴和次优回贴的配对,过滤掉不能配对的读长;配对后的SR信号读长根据主要回帖和次优回帖的位置和方向信息判断SV类型,并根据SV类型、回贴方向和断点坐标将标记为同一SV事件的SR信号进行聚类后形成SR信号聚类;和或将进入PE信号分析流程的读长根据QNAME分组,并在每个组中根据读长的FLAG值进行R1和R2的配对,过滤掉不能配对的读长对;基于配对的R1和R2的位置和方向信息判断SV类型,并根据SV类型、回贴方向和断点坐标将标记为同一SV事件的PE信号进行聚类后形成PE信号聚类;c.对所述SR信号聚类和或所述PE信号聚类进行过滤,从而获得过滤后的信号聚类,其指示基因组区域中的SV;其中,过滤掉的信号聚类包括以下至少一项:具有高相似性的信号聚类、位于基因组重复区域的信号聚类、嵌合体信号聚类、简单模板的信号聚类、低平均mapq的信号聚类、不在BED文件定义区域的信号聚类、SV大小小于一定阈值的信号聚类以及去重后模板的读长对数量小于过滤阈值的信号聚类;和任选地d.输出结果报告。
全文数据:
权利要求:
百度查询: 广州燃石医学检验所有限公司 检测基因组区域中的结构变异的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。