首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】胚系SNV、InDel变异的鉴定方法、系统以及可读存储介质_广州嘉检医学检测有限公司_202410160753.2 

申请/专利权人:广州嘉检医学检测有限公司

申请日:2024-02-05

公开(公告)日:2024-05-17

公开(公告)号:CN117711487B

主分类号:G16B20/20

分类号:G16B20/20;G16B30/10;G16B40/00;G06N3/08;G06N7/01

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.04.02#实质审查的生效;2024.03.15#公开

摘要:本发明公开了胚系SNV、InDel变异的鉴定方法、系统以及可读存储介质,所述方法包括以下步骤:对原始测序数据进行过滤、比对及排序后,分别通过基于位置序列堆积计数方法、基于深度神经网络算法、基于复杂区域局部重比对算法、基于贝叶斯统计学方法得到4个候选变异集,进行合并后,再对各变异位点的基因型进行修正,然后去除冗余的变异表示,对变异进行打分并重新标记过滤变异,由此鉴定出胚系SNV、InDel变异。本发明在通过若干个指标划定适当阈值以控制单个方法假阳性率的同时,整合多个方法的结果并进行后处理,特别是相同的复杂变异不同表示方式的去冗余以及基因型的综合判断,最终在控制住假阳性率的前提下提升敏感度。

主权项:1.胚系SNV、InDel变异的鉴定方法,其特征在于,包括以下步骤:S1、对原始测序数据进行过滤;过滤后测序数据的序列与人类基因组比对,得到序列比对结果文件;然后进行排序,得到有序的序列比对结果文件;S2、对有序的序列比对结果文件分别进行如下处理:(1)基于位置序列堆积计数方法得到候选变异位点,得到候选变异集A;所述候选变异集A具体通过以下方式获取:首先,位置序列堆积计数方法通过分开处理单双端数据,对基因组各位置的堆积序列碱基信息进行计数统计,得到两个分别代表单端和双端的候选变异位点集;然后,将单双端这两个候选变异集进行相互验证和整合,形成一个非冗余候选变异集,即得到候选变异集A;最后,对候选变异集A中的每个变异,根据堆叠序列深度和变异等位基因频率两项指标划分为高可信变异和低可信变异;(2)基于深度神经网络算法得到候选变异位点,得到候选变异集B;所述候选变异集B具体通过以下方式获取:使用基于深度神经网络算法的工具对序列比对文件进行变异检测得到候选位点集,然后过滤掉候选位点集中野生纯合位点,得到基于深度神经网络算法的候选变异位点集,即得到候选变异集B;(3)基于复杂区域局部重比对算法得到候选变异位点,得到候选变异集C;所述候选变异集C具体通过以下方式获取:使用基于复杂区域局部重比对算法的工具,对序列比对文件进行变异检测,得到候选变异位点集,即得到候选变异集C;然后,通过基于复杂区域局部重比对算法得到两个变异相关指标:深度均一化后变异位点质量值和变异等位基因频率,根据所述两个变异相关指标将候选变异位点划分为低可信位点和高可信位点;(4)基于贝叶斯统计学方法得到候选变异位点,得到候选变异集D;所述候选变异集D具体通过以下方式获取:使用基于贝叶斯统计学方法的工具对序列比对文件进行变异检测得到候选位点集,将位点集中野生纯合位点过滤得到候选变异位点集,即得到候选变异集D;通过基于贝叶斯统计学方法得到的两个变异相关指标:深度均一化后变异等位数和等位数均一化后变异位点质量值,根据所述两个变异相关指标将候选变异位点划分为低可信位点和高可信位点;S3、候选变异集A、B、C、D的变异位点按照位置和变异类型进行合并,得到候选变异并集的变异结果;S4、对各变异位点的基因型进行修正,得到基因型修正后的候选变异并集;S5、对基因型修正后的候选变异并集,去除冗余的变异表示,对变异进行打分并重新标记过滤变异,得到最终变异位点集,由此鉴定出胚系SNV、InDel变异;SNV的含义为单核苷酸变异,InDel的含义为插入与缺失。

全文数据:

权利要求:

百度查询: 广州嘉检医学检测有限公司 胚系SNV、InDel变异的鉴定方法、系统以及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术