首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种重测序数据库中假阳性变异位点的筛选方法_西安医学院_202010831360.1 

申请/专利权人:西安医学院

申请日:2020-08-18

公开(公告)日:2024-05-24

公开(公告)号:CN112086131B

主分类号:G16B30/10

分类号:G16B30/10;G16B20/50;G16B20/30;G16B50/30

优先权:

专利状态码:有效-授权

法律状态:2024.05.24#授权;2021.01.01#实质审查的生效;2020.12.15#公开

摘要:本发明公开了一种高通量测序中假阳性变异位点的筛选方法,首先下载参考基因组序列,通过计算机语言脚本对上述参考基因组序列的正链信息进行覆盖,覆盖时每次向前步移1bp,获取模拟的二代测序数据,将获得的reads比对到参考基因组序列上,从比对的结果中查找出99个核苷酸全部匹配、且只有一个错配信息的位点信息即为初始的潜在假阳性SNV位点,获得假阳性SNV位点对应的反链信息,将正链信息和反链信息合并得到潜在的假阳性SNV位点数据库,获得的数据库位点与COSMIC数据库中所有单个替换突变的位点信息进行比较,比较后将相同的位点信息保留,即获得在COSMIC数据库中潜在的假阳性变异位点。

主权项:1.一种重测序数据库中假阳性变异位点的筛选方法,其特征在于,按照以下步骤具体进行:步骤1、下载参考基因组序列,通过计算机语言脚本对上述参考基因组序列的正链信息进行覆盖,覆盖时每次向前步移1bp,获取模拟的二代测序数据,得到了100bp的二代测序reads;将所述获得的含有一个或者多个N的核苷酸序列给予去除;步骤2、将步骤1中获得的reads比对到参考基因组序列上,从比对的结果中查找出99个核苷酸全部匹配、且只有一个错配信息的位点信息,这些位点即为初始的潜在假阳性SNV位点;步骤2.1、使用序列比对软件blat将步骤1获得的模拟二代测序数据比对到参考基因组序列上;步骤2.2、对步骤2.1中获得的文件结果,筛选出只有1个错误匹配且其他位点完全匹配的序列,这些位点即为初始的潜在假阳性SNV位点;步骤2.3、通过位点信息和错位匹配位置信息,计算获得步骤2.2中错误匹配位点在基因组上的位置信息;步骤3、获得步骤2中假阳性SNV位点对应的反链信息,将上述正链信息和反链信息合并得到潜在的假阳性SNV位点数据库;步骤3.1、将过滤频次为=10认为是在现实测序中可能被检测到的SNV位点,低于10则认为是偶然性获得的SNV位点;步骤3.2、将步骤3.1中获得的位点信息中,位于重复区域的去除;步骤3.3、对步骤3.2中获得的位点信息进行互补配对并合并,最终获得了若干个位点作为最终人基因组中潜在假阳性位点数据库;步骤4、将步骤3中获得的数据库位点与COSMIC数据库中所有单个替换突变的位点信息进行比较,比较后将相同的位点信息保留,即获得在COSMIC数据库中潜在的假阳性变异位点;步骤4.1、下载COSMIC数据信息,提取所有的单个替换突变以备后续分析;步骤4.2、将步骤4.1获得的位点变异信息与步骤3.3获得的位点信息进行比较,比较后将相同的位点信息保留;步骤5、千人基因组中潜在的假阳性变异位点和实验验证:步骤5.1、下载千人基因组数据信息,保留只有单个位点的变异信息;步骤5.2、将步骤5.1中的位点信息与步骤3.3中获得的位点信息进行比较;步骤5.3、根据步骤5.2中的位点信息在千人基因组中的排布特征,筛选可能为假阳性变异的位点;步骤5.4、在步骤5.3确定的可能为假阳性变异位点的两端的特异性序列处设计特异性引物,进行PCR扩增并进行一代测序,确认该位点是否为假阳性变异位点。

全文数据:

权利要求:

百度查询: 西安医学院 一种重测序数据库中假阳性变异位点的筛选方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。