买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江天科高新技术发展有限公司
摘要:本发明公开了一种基于16SrDNA序列的菌种鉴定方法,步骤包括:将参考16SrDNA序列按照引物序列确定参考序列方向;根据预定长度将确定方向后的参考序列进行k‑mer切分;将含有一定数量的简并碱基序列进行展开,构建参考序列的k‑mer索引库;将查询序列按照预定长度进行k‑mer切分,构建k‑mer序列集合;根据特定公式以及特定序列相似性值计算查询序列的最小比对k‑mer数(kmin);比对参考序列k‑mer索引库,统计查询序列的每个k‑mer的比对情况;根据kmin筛选出符合条件的候选参考序列,分别将查询序列与候选参考序列进行两两比对,计算序列相似性,最终输出查询序列的比对结果。本发明可以缩短海量序列查询时间以及减少海量数据存储空间,并为菌株鉴定提供了一个新的高效的技术手段。
主权项:1.一种基于16SrDNA序列的菌种鉴定方法,其特征在于,包括以下步骤:步骤1,构建参考序列k-mer索引库;步骤1.1序列方向确定:根据533R引物序列与16SrDNA参考数据库中序列进行比对以确定序列方向,其中533R引物序列为5’-TTACCGCGGCTGCTGGCAC-3’;步骤1.2k-mer切分:根据特定长度对所有序列进行k-mer切分;步骤1.3k-mer序列分类:根据简并碱基数量将k-mer序列分为3类,第一类为不包含简并碱基;第二类包含简并碱基并且数量小于等于2;第三类包含简并碱基并且数量大于2;步骤1.4展开简并碱基:针对上述第二类k-mer序列,即存在简并碱基并且数量小于等于2的k-mer序列,根据简并碱基对应的碱基进行逐步展开;步骤1.5k-mer索引构建:将上述第一类k-mer序列,第二类经过展开后的k-mer序列,以及第三类k-mer序列合并构建k-mer索引库,包含k-mer序列,出现频次和涉及的参考序列ID;步骤2,查询序列菌种鉴定分析;步骤2.1k-mer切分:将16SrDNA查询序列按照特定长度进行k-mer切分,构建k-mer序列集合;步骤2.2kmin计算:根据特定公式以及特定序列相似性值计算查询序列的最小比对k-mer数kmin;步骤2.3比对k-mer索引库:将查询序列的k-mer序列集合与参考k-mer索引库进行比对,并统计查询序列每个k-mer的比对情况;步骤2.4k-mer统计:根据与索引库的比对情况,统计查询序列比对上相同参考序列的k-mer个数;步骤2.5候选参考序列筛选:根据kmin筛选出符合条件的候选参考序列;步骤2.6序列两两比对:将查询序列分别与候选参考序列进行两两比对,计算序列相似性以及序列联配结果;步骤2.7结果输出:根据序列比对结果输出序列相似性值,物种拉丁名,物种菌株号;所述特定长度为31个核苷酸碱基;所述kmin计算公式如下: ;其中,L表示查询序列长度;K表示指定k-mer长度;S表示特定序列相似性值;int表示数值取整;所述特定序列相似性值设置如下:根据基因序列一般分析原则,相似性≥99%时,鉴定结果为种水平;相似性≥97%且99%时,鉴定结果为属水平。
全文数据:
权利要求:
百度查询: 浙江天科高新技术发展有限公司 一种基于16S rDNA序列的菌种鉴定方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。