买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:天津大学
摘要:本发明公开了一种大规模寡核苷酸池的空间分层DNA存储方法,采用一种空间分层DNA编码与解码方法,可实现实时数据读取;将无序的DNA链在空间上组织成一个可寻址的碱基阵列,按顺序将实时数据编码到顺序编码层中,其中碱基被映射到空间阵列中所有链的相同位置;在数据恢复方面,开创了一种实时并加速处理的方法,在空间上形成编码层,并使用纠错码来填补碱基缺少间隙,从而实现连续、实时的流式传输;此外,开发了一种分层空间‑时间恢复方法,以促进无差错数据流,在空间上实现一个层内多个信号的即时共识,在时间上从先前成功解码的数据流中更新数据流;本发明提出的纠错编码方法与数据恢复方法可以匹配测序过程,实现测序与数据解码读出实时进行。
主权项:1.一种大规模寡核苷酸池的空间分层DNA存储方法,其特征在于,所述方法包括以下步骤:1将用户数据分组得到L个具有规则长度K比特的数据层,并对每个单独的数据层分别进行纠错编码,得到长度为N,NK比特的编码数据层,根据确定的比特对与碱基之间的映射规则,将编码数据层进行转码,得到编码碱基层;2按照测序读出方式的不同将编码碱基层中的碱基依次分配至DNA序列从1到L的位置,构成单端读取的长度为L的DNA序列的数据载体部分以及将编码碱基层依次分配至DNA序列两端对称的位置,得到双端同时读取的长度为2L的DNA序列的数据载体部分;3对生成的DNA数据承载序列添加标号与引物,得到大规模的寡核苷酸DNA序列;4对合成得到的每个寡核苷酸池进行测序文库制备,将寡核苷酸对齐固定在固相载体上的高通量测序技术实现边测序边读出;5对齐并固化于固相载体表面的寡核苷酸序列,经过实时光信号或电信号采集、信号分析、增量式碱基识别以及引物与标号识别,使用天然不修改的dNTP去聚合检测时,得到碱基游程长度度量形式的部分游程序列,碱基游程长度表示采用当前核苷酸进行聚合时,识别得到的连续碱基的长度;使用修改的带有终止子与荧光基团的dNTP去聚合检测时,通过光检测得到是否存在信号,即判断单个碱基是否存在;6根据识别得到的引物与标号,得到不同碱基信号形式的多副本信号,对信号进行聚类,然后进行信号的多副本合并,并转化生成一致性游程序列;7根据测序过程中是否存在插入与删节错误,设置游程序列反馈更新机制,不存在插入与删节错误情形下,将一致性游程序列直接转化为编码碱基层;在存在插入与删节错误传播的情形下,利用前一层成功译码的反馈结果对部分游程序列进行更新,并采用多副本多数投票判决生成一致性游程序列,随后按照确定参考碱基序列,将一致性部分游程序列转换为部分碱基序列,并将部分碱基序列依次分配至编码碱基层的确定位置,相同位置的碱基形成单独的编码碱基层;8统计并更新全部编码碱基层的碱基比例,通过阈值比较,输出未成功解码的编码碱基层,并送入译码器进行解码,逐层恢复原始用户数据。
全文数据:
权利要求:
百度查询: 天津大学 一种大规模寡核苷酸池的空间分层DNA存储方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。