买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:烟台大学
摘要:本发明属于基因组结构变异检测技术领域,具体涉及基于基准集的基因组结构变异检测的评估方法、系统,依次经确定搜索空间、计算重叠、计算大小相似性分数、结构变异类型匹配、计算序列一致性分数的标准进行变异匹配,得到匹配的结构变异后,根据断点距离和变异大小比进行评估,使得评估更为准确。
主权项:1.一种基于基准集的基因组结构变异检测的评估方法,其特征在于,包括以下步骤:S1:基于用户变异识别结果集和基准集,分别提取变异数据,包括:染色体名称、起始位置、终止位置、结构变异类型、结构变异长度、参考序列、变异序列,根据提取的变异数据对应构建第一用户变异识别结果集和第一基准集;S2:基于染色体名称,根据第一基准集中变异位点的结构变异长度,确定搜索空间;S3:对第一用户变异识别结果集中的每一个变异与第一基准集中搜索空间内的每一个变异,分别向两端扩展第三长度后,得到第二用户变异识别结果集和第二基准集;计算第二用户变异识别结果集中变异与第二基准集中每一个变异的重叠,若存在重叠,则将存在重叠的两个变异记为第一匹配对;S4:计算第一匹配对的变异的大小相似性,得到大小相似性分数;若大小相似性分数大于大小相似性分数阈值,则记为第二匹配对;S5:基于结构变异类型,第二匹配对的变异进行结构变异类型匹配,若满足匹配条件,则记为第三匹配对;S6:计算第三匹配对的变异的序列一致性,得到序列一致性分数;若序列一致性分数大于序列一致性分数阈值,则记为匹配的结构变异;S7:根据匹配的结构变异,分别统计第一用户变异识别结果集与第一基准集中匹配的结构变异的数量,记为第一用户变异识别结果集的真阳性数,与第一基准集的真阳性数;分别统计第一用户变异识别结果集与第一基准集中未匹配的结构变异的数量,记为第一用户变异识别结果集的假阳性数,与第一基准集的假阴性数;根据真阳性数、假阳性数、假阴性数,计算召回率、准确度、F1分数,以及计算断点距离、变异大小比,进行评估。
全文数据:
权利要求:
百度查询: 烟台大学 基于基准集的基因组结构变异检测的评估方法、系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。