首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于大小喷泉码及MRC算法利用DNA进行信息存储方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:武汉大学

摘要:本发明公开了一种基于大小喷泉码及MRC算法利用DNA进行信息存储的方法及系统,包括编码生成数据包,将编码数据包转换成DNA序列时使用MRC算法自动规避掉不希望出现的子序列,将合格的DNA序列输出去到文件中保存;解码程序接收到DNA序列,转换成二进制数据;对转换来的数据先截取随机种子,再利用MRC解码算法提取所有的小喷泉码,再进行小喷泉码解码;利用小喷泉码结果以及随机种子对大喷泉码进行解码。本发明提供了喷泉码在DNA存储中的一种工程实现方法,有效应对了DNA存储场景中的规避序列问题,便于喷泉码在DNA存储中的工程实现。

主权项:1.一种基于大小喷泉码及MRC算法利用DNA进行信息存储方法,其特征在于,包括以下步骤:步骤1:针对待存储的源文件进行信源编码,即对源文件进行拼接文件名、生成哈希值、获取比特长、对比特长参数拼接哈希值处理;步骤2:对处理后的数据进行分组处理;步骤3:基于大小喷泉码及MRC算法对分组数据进行编码;编码数据包的结构是头部为随机种子,中间部分为大喷泉码编码数据数据,尾部为小喷泉码编码数据,最后为纠错编码数据,用于对序列的正确性进行检测和纠正;采用大喷泉码对分组数据的内容和、文件名字以及一个哈希值进行编码,生成编码数据;哈希值用于解码时的自校验;采用小喷泉码对文件比特长及其生成的一个哈希值进行编码,哈希值用于小喷泉码解码时的自校验;采用MRC算法将大喷泉码编码生成的编码数据转换成DNA序列,结合用户输入的规避序列,自动编码输出不含指定规避序列的DNA序列;对于MRC算法转换的不等长的DNA序列,采用小喷泉码编码将DNA序列填充为等长;所述随机种子的比特长根据编码时用户要求的DNA序列数量确定,将确定比特长的随机种子动态拼接在数据包头部;步骤4:DNA序列存储;步骤5:利用大喷泉码、MRC算法和小喷泉码对DNA序列解码;根据与编码约定好的随机种子的范围截取随机种子,再使用MRC算法对所有数据包除去随机种子后的剩余部分进行解码,提取出所有的小喷泉码,然后解码小喷泉码,解码成功则利用小喷泉码解码出的内容进行哈希自校验确定随机种子;确定随机种子与小喷泉码的编码内容后,采用大喷泉码解码;步骤5的具体实现包括以下子步骤:步骤5.1:将DNA序列利用纠错编码筛选出所有合格的DNA序列;步骤5.2:按照种子空间,取所有序列的头部作为随机种子;步骤5.3:采用MRC算法解码DNA序列,剩余部分转换成二进制数据,得到所有小喷泉码编码数据;步骤5.4:小喷泉码尝试解码;步骤5.5:判断是否解码成功;若是,则执行步骤5.6;若否,则执行步骤5.12;步骤5.6:小喷泉码末尾哈希值进行自校验;步骤5.7:判断自校验是否成功;若是,则执行步骤5.8;若否,则执行步骤5.12;步骤5.8:确定种子空间,利用小喷泉码结果进行大喷泉码解码;步骤5.9:判断解码是否成功;若是,则执行步骤5.10;若否,则给出解码失败原因为DNA序列数量不够,本流程结束;步骤5.10:大喷泉码解码数据进行哈希自校验;步骤5.11:判断哈希自校验是否成功;若是,则解码成功,本流程结束;若否,则给出解码失败原因为DNA变异,有错误序列参与解码,本流程结束;步骤5.12:判断种子空间是否达到预定的上限;若是,则解码失败,给出解码失败原因为序列数量不够或基因变异有错误序列参与解码,本流程结束;若否,则种子空间加1,并回转执行步骤5.2;其中,喷泉码解码使用线性消解法与高斯消元法组合的方式,先用线性消解法,利用1度的数据包快速解出一些数据,再利用高斯消元法去解剩余的因缺少1度而无法继续解码的数据;从大喷泉码解码出的数据末尾截取哈希值,再对剩余的数据使用与编码端相同的哈希算法生成哈希值进行自校验,通过自校验后,从剩余数据的末尾截取与编码约定的字节长作为文件名,剩余部分即为源文件内容,保存到文件中即恢复出存储的源文件。

全文数据:

权利要求:

百度查询: 武汉大学 基于大小喷泉码及MRC算法利用DNA进行信息存储方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。