首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

靶向增强的DNA去甲基化 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杰克逊实验室

摘要:本文尤其提供了用于向哺乳动物细胞中的靶DNA序列递送增强的去甲基化活性的组合物和方法。该组合物和方法可用于靶向的基因的活性调节,或用于产生基因调控网络。

主权项:1.一种去甲基化复合物,其包含:a核糖核蛋白复合物,其包括:i核酸酶缺陷的RNA指导DNA核酸内切酶,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶是核酸酶缺陷的Cas9或核酸酶缺陷的Cpf1;和ii多核苷酸,包含:1与靶多核苷酸序列互补的DNA靶向序列;2所述核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和3一个或多个PUF结合位点PBS序列,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶通过所述结合序列与所述多核苷酸结合;和b去甲基化蛋白缀合物,其包含:i具有C-末端和N-末端的PUF结构域;ii与所述PUF结构域的C-末端可操作地连接的TET去甲基化结构域;和iii与所述PUF结构域的N-末端可操作地连接的去甲基化增强子结构域,以形成蛋白质缀合物,其中所述去甲基化增强子结构域是生长阻滞和DNA损伤诱导αGADD45A结构域或NEIL2结构域,和其中所述去甲基化蛋白缀合物通过所述PUF结构域与所述一个或多个PBS序列的结合而与所述核糖核蛋白复合物结合以形成去甲基化复合物。

全文数据:靶向增强的DNA去甲基化相关申请的交叉引用本申请要求于2016年9月13日提交的美国临时申请No.62393,944、2017年4月13日提交的美国临时申请No.62485,210和2017年7月20日提交的美国临时申请No.62535,113的权益,其全部内容为所有目的并入本文作为参考。作为ASCII文件提交的“序列表”、表格或计算机程序列表附录的引用2017年9月13日创建,475千字节,机器格式IBM-PC,MSWindows操作系统的文件52867-501002WO中编写的序列表在此引入作为参考。背景技术在CRISPRCas系统中,Cas9蛋白和sgRNA单指导RNA构成充分的双组分DNA核酸内切酶,其特异性由sgRNA上的靶标匹配序列提供,而核酸内切酶活性存在于Cas9蛋白上。当与sgRNA复合时,在其核酸酶结构域上具有突变的核酸酶缺陷或核酸酶缺损的Cas9蛋白例如,dCas9保留DNA结合活性。dCas9蛋白可以通过与通过sgRNA匹配的位点的蛋白质融合来系着和定位效应结构域或蛋白质标签,因此构成RNA指导的DNA结合酶。dCas9可以与转录激活结构域例如,VP64或阻遏物结构域例如,KRAB融合,并且由sgRNA指导以分别激活或抑制靶基因。dCas9还可以与荧光蛋白融合并实现染色体区域的活细胞荧光标记。然而,在这样的系统中,仅一种Cas9-效应子融合是可能的,因为sgRNA:Cas9配对是排它性的。此外,在需要多个拷贝的蛋白质标签或效应子融合体来达到一些生物学阈值或信号检测阈值的情况下,通过与dCas9蛋白直接融合而使效应子或蛋白质标签多聚化在技术上受到限制,受到如难以递送编码这种融合体的大DNA的困难或由于蛋白质大小而将这种大蛋白质翻译或转位到细胞核中的困难的约束。甲基胞嘧啶是通过在CpGDNA序列的胞嘧啶环的5位共价添加甲基的过程产生的表观遗传标记。在哺乳动物细胞中,5-甲基胞嘧啶5mC的形成通过DNA甲基转移酶催化和维持。去除甲基以恢复未甲基化DNA的去甲基化途径涉及10-11易位TET蛋白质家族。这些是催化导致用未甲基化的胞嘧啶替换5mC的初始和关键步骤的TET甲基胞嘧啶双加氧酶。CpG甲基化是染色质的多层面表观遗传修饰的部分,其形成细胞分化、基因表达和细胞稳态的维持。DNA甲基化是印记、基因的等位基因表达的调节的主要机制。异常的DNA甲基化涉及各种疾病,包括但不限于癌症、印迹障碍和神经疾病Robertson,K.D.,DNAmethylationandhumandisease.NatRevGenet,2005.68:p.597-610。已经尝试通过引入DNA去甲基化酶和或DNA甲基转移酶来调节靶细胞中的甲基化状态。然而,这种尝试导致靶细胞甲基化状态的非特异性的全局变化。同时,CpG甲基化事件在特定基因组基因座处的因果效应的确定仍然具有挑战性,主要是由于缺乏用于在活细胞中将5mC靶向转化为未甲基化胞嘧啶的简单方法。因此,本领域需要允许在特定基因座处编辑甲基化状态以理解胞嘧啶甲基化的生物学并开发与改变的胞嘧啶甲基化去甲基化途径相关的疾病的疗法的工具。本文公开的尤其是本领域中的这些和其他问题的解决方案。发明内容在一个方面,提供了去甲基化复合物。该去甲基化复合物包括:a核糖核蛋白复合物,包含:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,其包含:1与靶多核苷酸序列互补的DNA靶向序列;2核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和3一个或多个PUF结合位点PBS序列,其中核酸酶缺陷的RNA指的DNA核酸内切酶通过结合序列与多核苷酸结合;和b去甲基化蛋白缀合物,其包含:i具有C-末端和N-末端的PUF结构域;ii可操作地连接到PUF结构域的C-末端的TET去甲基化结构域;和iii与PUF结构域的N-末端可操作地连接的去甲基化增强子结构域,以形成蛋白质缀合物,和其中去甲基化蛋白缀合物通过PUF结构域与一个或多个PBS序列结合而与核糖核蛋白复合物结合以形成去甲基化复合物。在另一方面,提供了在哺乳动物细胞中使靶核酸序列去甲基化的方法。该方法包括:a提供含有需要去甲基化的靶核酸的哺乳动物细胞;b向哺乳动物细胞递送编码核酸酶缺陷的RNA指导DNA核酸内切酶的第一多核苷酸;c向哺乳动物细胞递送第二多核苷酸,其包含:i与靶多核苷酸序列互补的DNA靶向序列;ii核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列,和iii一个或多个PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与第二多核苷酸结合;d向哺乳动物细胞递送编码去甲基化蛋白缀合物的第三多核苷酸,该去甲基化蛋白缀合物包含:i具有C-末端和N-末端的PUF结构域;ii可操作地连接至PUF结构域的C-末端的TET去甲基化结构域;和iii与PUF结构域的N-末端可操作地连接的去甲基化增强子结构域,以形成蛋白质缀合物,和由此递送的去甲基化蛋白缀合物使细胞中的靶核酸序列去甲基化。在一个方面,提供了去甲基化复合物。该去甲基化复合物包含:a核糖核蛋白复合物,其包含:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,其包含:1与靶多核苷酸序列互补的DNA靶向序列;2核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和3一个或多个PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与多核苷酸结合;和b去甲基化蛋白缀合物,其包含:i具有C-末端的PUF结构域;ii具有N-末端和C-末端的去甲基化增强子结构域,其中去甲基化增强子结构域的N-末端可操作地连接到PUF结构域的C-末端;和iii与去甲基化增强子结构域的C-末端可操作地连接的TET去甲基化结构域;和其中去甲基化蛋白缀合物通过PUF结构域与一个或多个PBS序列结合而与核糖核蛋白复合物结合以形成去甲基化复合物。另一方面,提供了在哺乳动物细胞中使靶核酸序列去甲基化的方法。该方法包括:a提供含有需要去甲基化的靶核酸的哺乳动物细胞;b向哺乳动物细胞递送编码核酸酶缺陷的RNA指导DNA核酸内切酶的第一多核苷酸;c向哺乳动物细胞递送第二多核苷酸,其包含:i与靶多核苷酸序列互补的DNA靶向序列;ii核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和iii一个或多个PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与第二多核苷酸结合;d向哺乳动物细胞递送编码去甲基化蛋白缀合物的第三多核苷酸,该去甲基化蛋白缀合物包含:i具有C-末端的PUF结构域;ii具有N-末端和C-末端的去甲基化增强子结构域,其中去甲基化增强子结构域的N-末端可操作地连接到PUF结构域的C-末端;和iiiTET去甲基化结构域,其可操作地连接到去甲基化增强子结构域的C-末端,由此递送的去甲基化蛋白缀合物使细胞中的靶核酸序列去甲基化。在一个方面,提供了去甲基化复合物。该去甲基化复合物包括:a核糖核蛋白复合物,其包括:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,其包含:1与靶多核苷酸序列互补的DNA靶向序列;2核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;3第一PUF结合位点PBS序列;和4第二PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与多核苷酸结合;b去甲基化蛋白缀合物,其包含:i具有C-末端的第一PUF结构域,和ii与第一PUF结构域的C-末端可操作地连接的TET去甲基化结构域,其中去甲基化蛋白缀合物通过第一PUF结构域结合第一PBS序列而与核糖核蛋白复合物结合;和c去甲基化增强子缀合物,其包含:i第二PUF结构域;和ii与第二PUF结构域可操作地连接的去甲基化增强子结构域,其中去甲基化增强子缀合物通过第二PUF结构域结合第二PBS序列而与核糖核蛋白复合物结合以形成去甲基化复合物。在另一个方面,提供了在哺乳动物细胞中使靶核酸序列去甲基化的方法。该方法包括:a提供含有需要去甲基化的靶核酸的哺乳动物细胞;b向哺乳动物细胞递送编码核酸酶缺陷的RNA指导DNA核酸内切酶的第一多核苷酸;c向哺乳动物细胞递送第二多核苷酸,其包含:i与靶多核苷酸序列互补的DNA靶向序列;ii核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;iii第一PUF结合位点PBS序列,和iv第二PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与第二多核苷酸结合;d向哺乳动物细胞递送编码去甲基化蛋白缀合物的第三多核苷酸,该去甲基化蛋白缀合物包含:i第一PUF结构域;和ii去甲基化结构域,该去甲基化结构域可操作地连接到第一PUF结构域的C-末端,和e向哺乳动物细胞递送编码去甲基化增强子缀合物的第四多核苷酸,该去甲基化增强子缀合物包含:i第二PUF结构域;和ii与第二PUF结构域可操作地连接的去甲基化增强子结构域,由此递送的去甲基化蛋白缀合物使细胞中的靶核酸序列去甲基化。在另一方面,提供了一种试剂盒。该试剂盒包括:i如本文包括其实施方案提供的核糖核蛋白复合物或其编码核酸;和ii本文包括其实施方案提供的去甲基化蛋白缀合物或其编码核酸。在另一方面,提供了试剂盒。该试剂盒包括:i本文包括其实施方案提供的核糖核蛋白复合物或其编码核酸;ii本文包括其实施方案提供的去甲基化蛋白缀合物或其编码核酸;和iii本文包括其实施方案提供的去甲基化增强子缀合物或其编码核酸。在另一个方面,提供了包含本文包括其实施方案提供的去甲基化复合物的细胞。应当理解,本文描述的任何实施方案,包括仅在实施例部分中描述的那些或仅在本发明的一个方面中的那些,可以与任何一个或多个其他实施方案组合,除非特别排除或另外方面是不合适的。附图说明图1A-1D.这些图显示PUF结合位点PBS序列插入到sgRNA3'-末端基本上不影响dCas9sgRNA功能,并且使用所述3组分CRISPRCas复合物系统可以实现激活物的独立募集和多聚化。图1A是显示所述3-组分CRISPRCas复合物系统右上的示意图,其通过将常规双杂交dCas9融合设计左上分割成三杂交系统来对其进行改进,其中sgRNA-PBS桥接dCas9sgRNA的DNA结合活性与PUF融合体提供的效应子功能。中间图表示代表性PUF即,PumilioFBF结构域的结构,其显示沿C至N方向的8个重复以及与沿5'至3'方向的8聚体靶RNA的相应相互作用。PUFRNA识别代码表显示了示例性的二-残基和识别的相应RNA碱基。在下图中,为简单起见采用符号表格来描述4种PUF亚型和相应的PUF结合位点PBS及其序列。图1B,上图,是用于测试dCas9-VP64在sgRNA的3'末端处插入不同数量的PBS后结合并激活tdTomato转基因的能力的实验的示意图,例如,用于测试sgRNA-PBS具有0、5、15、25或47个PBS对dCas9::VP64构建体激活TetO::tdTomato转基因的能力的影响的实验设置。下图是柱状图,其显示如通过荧光激活细胞分选FACS测量的用图下方的图例中所示的不同构建体转染的细胞的tdTomato荧光的平均倍数变化±SEM相对于dCas9-VP64sgCtl-0×PBSa对照。图例以三个参数描述了使用的sgRNA:sgRNA匹配是指sgRNA识别的DNA靶标;#PBS和PBS类型分别表示附接在sgRNA末端的PBS的数量和类型。图1C,上图,是描述测试通过具有不同数量的附接PBS所述激活物激活TetO::tdTomato转基因的实验的示意图。下图是柱状图,其显示用图下方的图例中所示的不同构建体转染的细胞的tdTomato荧光的倍数变化±S.E.M.相对于对照dCas9PUFb-VP64sgCt1-0xPBSb。图例以PBS的数量和类型以及由阴影框指示的sgRNA识别的DNA靶标描述了所使用的PUF亚型PUF-VP64和所使用的sgRNA-PBS。图1D,上图,是说明测试所述激活物亚型在激活TetO::tdTomato转基因中的独立性的实验的示意图。下图是柱状图,其显示用图下方的图例中所示的不同构建体转染的细胞的tdTomato荧光的平均倍数变化±SEM相对于PUFPBS亚型x的相应对照dCas9PUFx-VP64sgCt1-5×PBSx。图例表明使用的PUF亚型PUF-VP64、PBS亚型5×PBS;“-”表示不含PBS的sgRNA和阴影框表示的DNA靶标sgRNA匹配。所有图显示三个重复测量的结果。图2A-2C.图2A和图2B涉及包含VP64和P65-HSF1的所述3-组分CRISPRCas复合物系统的组装。图2A是测试通过含有PBS32和PBS6272两者的sgRNA的募集来组装PUF3-2::VP64和PUF6-27-2::P65-HSF1的实验的示意图。活性通过tdTomato荧光报告体活性来测量。图2B是柱状图,其显示用具有4×[PBS32-PBS6272]异二聚体位点的Tet靶向sgTetO和非靶向sg对照sgRNA转染激活蛋白产生的相对平均tdTomato荧光。图2C显示了使用VP64PUFa::VP64相对p65HSF1PUFa::p65HSF1作为激活结构域与具有5xPBSa的对照sgRNA或具有0、1、5、15或25个拷贝的PBSa的TetO-靶向sgRNA相结合的所述3-组分系统激活物的比较。柱显示tdTomato荧光相对于使用对照sgRNAsgCt1的实验的平均倍数变化具有S.E.M.;n=3。图例指示sgRNA-PBS上PBSa数量#PBSa以及阴影框表示的DNA匹配。图3A-3C.该图显示Casilio-ME在将TET1CD递送到基因组位点和介导基因激活方面性能优于dCas9-指导系留tethering系统。图3A是通过棒糖lollipops显示的具有CpG高甲基化区域的hMLH1启动子的示意图。核苷酸的编号根据先前的研究,其报道区域C中的高甲基化与hMLH1沉默的强相关性Deng,G.等,MethylationofCpGinasmallregionofthehMLH1promoterinvariablycorrelateswiththeabsenceofgeneexpression.CancerRes,1999.599:p.2029-33。围绕高甲基化区域C设计的sgRNA分别通过短线上的数字及sgRNA-1和2靶有义和反义链显示。图3B显示用Casilio组分PUFa-TET1CD、TET1CD-PUFa或PUFa-p65HSF1及图下方阴影框表示的sgRNA组合转染的细胞中hMLH1mRNA水平的相对变化。图形描绘了Casilio系统,其显示了在每组实验中使用的效应模块,并且绘制了反映应用中的相应效应子的数据。图3C显示用dCas9-系留效应子dCas9-TET1CDC-末端融合体、TET1CD-dCas9N-末端融合体或dCas9-p65HSF1及图下方阴影框指示的sgRNA组合转染的细胞中hMLH1mRNA水平的相对变化。图形描绘了用于每组实验的dCas9融合体,并绘制数据以反映所使用的相应效应子。图3B和3C中PUMa也称为PUFa、TET1CD和p65HSF1结构域的字母“N”即N-末端和“C”即C-末端是指相应蛋白质结构域的N-末端和C-末端。图4A-4C.该图显示Casilio-ME通过将TET1活性靶向hMLH1启动子区域来介导甲基胞嘧啶的稳定去甲基化。图4A是用Casilio组分PUFa-TET1CD和图下方阴影框表示的sgRNA组合转染的细胞中hMLH1mRNA水平的相对变化的时间过程。曲线图上的图形描绘了Casilio-ME系统其显示了使用的羧基末端-TET1CD融合模块,且hMLH1mRNA水平的相对变化针对转染后时间其中细胞收获用于分析作图。误差棒表示来自一式三份实验的s.e.m.。图4B是使用如所示的抗-hMLH1或抗-β肌动蛋白单克隆抗体的从指定细胞样品提取的蛋白质的Western印迹分析。从未转染的细胞HEK293T未处理或用2.5μM5'-氮杂胞苷处理的细胞HEK293TAzaC、HEK293细胞293和在非靶向对照指导RNA存在下转染的HEK293T细胞NTC提取的蛋白质与用来自靶向hMLH1启动子区域的Casilio-Me组分转染的时程样品的提取物进行平行分析。图4C显示hMLH1启动子区域的胞嘧啶-胸腺嘧啶亚硫酸氢盐介导的单个CpG转化的频率。箭头指示与靶向sgRNA的结合位点重叠的CpG。坐标指示CpG相对于hMLH1转录起始位点的位置Deng,G.等,MethylationofCpGinasmallregionofthehMLH1promoterinvariablycorrelateswiththeabsenceofgeneexpression.CancerRes,1999.599:p.2029-33。HEK293细胞293的hMLH1启动子的远端部分未包括在该分析中。图4A中PUMa也称为PUFa和TET1CD结构域的字母“N”是指相应蛋白质结构域的N-末端。图5A-5C.该图显示了测试Casilio-MEDnmt效应子的不同构型。图5A显示iDnmt3a、iiDnmt3L和iiiDnmt3a-3L杂合体的C-末端区域与dCas9的N-末端的直接融合;ivDnmt3a、vDnmt3L和viDnmt3a-3L杂合体与dCas9的C-末端的直接融合。图5B显示iDnmt3a、iiDnmt3L和iiiDnmt3a-3L的C-末端区域与PUF结构域;ivDnmt3a、vDnmt3L和viDnmt3a-3L与PUF结构域的C-末端的PUF效应子融合体。图5C显示Casilio可以通过含有相应PBS的指导潜在地募集与不同PUF结构域融合的不同Dnmt效应子。图6A-6B.该图显示了通过将Casilio-MEDnmt模块靶向SOX2启动子诱导的SOX2基因表达变化。图6A显示用不同dCas9-Dnmt酶和对照指导或靶向SOX2启动子的指导转染的细胞中的相对SOX2表达水平。图6B显示用不同dCas9-Dnmt酶和对照指导或靶向SOX2启动子的指导转染的细胞中的相对SOX2表达水平。图7A-7E显示GADD45A增强Casilio-ME将TET1介导的激活施加于甲基化沉默的基因的能力。图7A描绘了Casilio和Casilio-ME平台以显示在每组实验中使用的效应子模块的各种组合。工程化蛋白质融合体显示有分别位于每个图的左侧和右侧的氨基末端和羧基末端。改变gRNA的骨架以包括5个拷贝的PUFa或者PUFa和PUFc结合位点。形状是任意的并且不是按比例绘制的,显示了DADD45AG-45A、TET1CD10-11甲基胞嘧啶双加氧酶催化结构域1418-2136和p65HSF1转录激活因子。图7B是通过棒糖显示的具有CpG高甲基化区域的hMLH1启动子的示意图。核苷酸的编号基于区域C中高甲基化与hMLH1沉默的强相关性Deng,CancerRes.599:2029-2033,1999。在高甲基化区域B和C周围设计的sgRNA通过短线上的数字显示。图7C显示了用如所示的Casilio-ME组分转染的HEK293T细胞中hMLH1mRNA水平的相对变化。图下方矩阵中的阴影框表示每个实验中使用的效应子和sgRNA。误差棒指示来自一式三份实验的s.e.m.。图7D显示了用指示的Casilio-ME效应子模块转染的HEK293T细胞的全细胞提取物的Western印迹分析的结果。泳道1-未转染的细胞;泳道2-PUFa-GADD45A-TET1CD;泳道3-PUFa-GADDA45A-TET1CD,具有甘氨酸-丝氨酸接头中的轻微变化;泳道4-GADD45A-PUFa-TET1CD;和泳道5-PUFa-TET1CD。50μg蛋白质在10%SDS-PAGE上分离,并用指示的抗体进行免疫印迹。显示了以kDa计的大小标志物。图7E显示了用如所示的Casilio-ME组分转染的HEK293T细胞中hMLH1mRNA水平的相对变化。图下方矩阵中的阴影框表示在非靶向gRNA或者包含PUFα结合位点PBSa或PUFa和PUFc结合位点PBSac的gRNA存在下在每个实验中使用的效应子。描绘以柱图以表示用PBSa-gRNA或PBSac-gRNA进行的实验。误差棒指示来自一式三份实验的s.e.m。图8A-8D:NEIL2,而非NEIL1、NEIL3或TDG,增强Casilio-ME将TET1介导的激活递送至甲基化沉默的基因的效率。图8A:图形描绘了Casilio-ME平台,以显示在每个实验中使用的PUFa-TET1CD效应子和基于NEIL的效应子模块。为简单起见,NEIL1、NEIL2和NEIL3被描绘为NEIL。显示了氨基和羧基末端分别位于各图的左侧和右侧的工程化蛋白质融合体。所示的gRNA骨架改变为包括5个拷贝的PUFa-结合位点5xPBSa。形状是任意的且不是按比例绘制的,显示了NEIL1、NEIL2和NEIL3NEIL、TET1CD10-11甲基胞嘧啶双加氧酶催化结构域1418-2136和PUFa。图8B:用所示的Casilio-ME组分转染的HEK293T细胞中hMLH1mRNA水平的相对变化。柱阴影反映不同组的所示PUFa融合体。误差棒指示来自一式三份实验的S.E.M.。图8C:图形描绘了Casilio-ME平台以显示在每个实验中使用的PUFa-TET1CD和基于TDG的PUFa融合效应子。显示了氨基和羧基末端分别位于每个图的左侧和右侧的蛋白质融合体。所示的gRNA骨架经改变以包括5个拷贝的PUFa-结合位点5xPBSa。形状是任意且不按比例绘制的,显示了TDG、TET1CD10-11甲基胞嘧啶二加氧酶催化结构域1418-2136和PUFa。图8D:用所示的Casilio-ME组分转染的HEK293T细胞中hMLH1mRNA水平的相对变化。柱阴影反映了所指示的PUFa融合体。误差棒指示来自一式三份实验的S.E.M.。图9A-9B:NEIL2二合一效应子增强了将TET1介导的激活递送至甲基化沉默的MLH1基因的Casilio-ME效率。图9A:图形描绘了Casilio-ME平台以显示在每个实验中使用的PUFa-TET1CD效应子和基于NEIL2的效应子模块。显示了氨基和羧基末端分别位于每个图的左侧和右侧的蛋白质融合体。所示的gRNA骨架经改变以包括5个拷贝的PUFa-结合位点5xPBSa。形状是任意的且不是按比例绘制的,且显示了NEIL2、TET1CD和PUFa。图9B:在MLH1gRNA灰色柱或非靶向gRNA黑色柱存在下用所示的Casilio-ME组分转染的HEK293T细胞中hMLH1mRNA水平的相对变化。误差棒表示来自一式三份实验的s.e.m。图10A-10B:NEIL2和TET1效应子模块的共同靶向强有力地增强TET1介导的MLH1激活。图10A:图形描绘了Casilio-ME平台以显示每个实验中使用的PUFa-TET1CD效应子和NEIL2效应子模块。显示了氨基和羧基末端分别位于每个图的左侧和右侧的工程化蛋白质融合体。所示的gRNA骨架经改变以包括5个拷贝的PUFa和PUFc-结合位点5xPBSa和5xPBSc。形状是任意的且不是按比例绘制的,显示了NEIL2、TET1CD、PUFa和PUFc。图10B:在不存在白色柱和存在NEIL2效应子模块的情况下用PUFa-TET1CD效应子转染的HEK293T细胞中hMLH1mRNA水平的相对变化。显示了PUFc-NEIL2黑色柱和NEIL2-PUFc灰色柱。误差棒表示来自一式三份实验的S.E.M.。图11A-11B:TET1介导的MLH1激活而无NEIL2募集到靶位点。图11A:图形描绘了Casilio-ME平台以显示每个实验中使用的PUFa-TET1CD效应子和NEIL2效应子模块。显示了氨基和羧基末端分别位于每个图的左侧和右侧的蛋白质融合体。显示的gRNA骨架被改变以包括5个拷贝的PUFa-结合位点5xPBSa而没有PUFc-结合位点。形状是任意的且不是按比例绘制的,显示了NEIL2、TET1CD、PUFa和PUFc。图11B:在不存在白色柱和存在NEIL2效应子模块的情况下,用PUFa-TET1CD效应子和含5个拷贝的BPSa的gRNA转染的HEK293T细胞中hMLH1mRNA水平的相对变化。显示了PUFc-NEIL2黑色柱和NEIL2-PUFc灰色柱。误差棒表示来自一式三份实验的S.E.M.。具体实施方式去甲基化增强子复合物本文包括其实施方案提供的组合物和方法提供甲基化编辑ME平台,其允许通过递送TET去甲基化结构域例如,TET催化结构域或其功能片段以及去甲基化增强子结构域例如,GADD45A结构域,NEIL2结构域至特定基因组基因座如CpG岛来靶向递送增强的去甲基化活性,从而诱导相对于不存在所述增强子结构域的情况下所述基因座增强的去甲基化DNA。本文提供的去甲基化结构域和去甲基化增强子结构域可以通过使用包含与核酸酶缺陷的DNA核酸内切酶例如,dCas9结合的多核苷酸例如,指导RNA和包括PUF结构域、去甲基化结构域例如,TET1催化结构域和去甲基化增强子结构域例如,GADD45A结构域或NEIL2结构域的蛋白质缀合物的复合物递送至哺乳动物细胞的基因组中的特定位点。在某些方面,去甲基化蛋白质缀合物包括:i具有C-末端和N-末端的PUF结构域;ii可操作地连接至PUF结构域的C-末端的TET去甲基化结构域;和iii与PUF结构域的N-末端可操作地连接的去甲基化增强子结构域以形成蛋白质缀合物,并且去甲基化蛋白质缀合物通过PUF结构域与一个或多个PBS序列结合而与核糖核蛋白复合物结合以形成去甲基化复合物。在某些其他方面,去甲基化蛋白质缀合物包括i具有C-末端的PUF结构域;ii具有N-末端和C-末端的去甲基化增强子结构域,其中去甲基化增强子结构域的N-末端可操作地连接到PUF结构域的C-末端;和iii与所述去甲基化增强子结构域的C-末端可操作地连接的TET去甲基化结构域;并且去甲基化蛋白质缀合物通过PUF结构域与一个或多个PBS序列结合而与核糖核蛋白复合物结合以形成去甲基化复合物。在其他某些方面,去甲基化蛋白缀合物包括i具有C-末端的第一PUF结构域,和ii可操作地连接至第一PUF结构域的C-末端的TET去甲基化结构域,其中去甲基化蛋白质缀合物通过第一PUF结构域与第一PBS序列结合而结合核糖核蛋白复合物;和去甲基化增强子缀合物,其包括i第二PUF结构域;和ii与第二PUF结构域可操作地连接的去甲基化增强子结构域,其中去甲基化增强子缀合物通过第二PUF结构域与第二PBS序列结合而结合核糖核蛋白复合物以形成去甲基化复合物。去甲基化增强子结构域可以连接于与去甲基化结构域去甲基化蛋白质缀合物相同的PUF结构域。在某些实施方案中,去甲基化增强子结构域可以通过单独的PUF结构域去甲基化增强子缀合物连接到指导RNA。本文包括其实施方案提供的去甲基化复合物基于包含CRISPRCas9和Pumilio蛋白的三组分杂交系统。出于本发明的目的,包含CRISPRCas9和Pumilio蛋白的三组分杂交系统也可以互换地称为Casilio系统,并且基于Casilio系统的甲基化编辑ME平台有时被称为Casilio-ME。本质上,去甲基化结构域例如,TET去甲基化酶与Pumilio蛋白或其功能片段PUF结构域融合,其结合Casilio系统中的PBS,因此将这些结构域带到Casilio系统特异性识别的任何目标基因座附近。在作为WO2016148994A8公开的国际申请PCTUS2016021491中公开的三组分CRISPRCas复合物系统的任何方面或实施方案可以用于本文提供的发明,该文献通过引用并入本文并用于所有目的。本文包括其实施方案提供的组合物和方法优于过去通过将DNA去甲基化酶引入靶细胞来调节靶基因的甲基化状态的尝试,因为本发明允许通过递送去甲基化酶以及所述去甲基化酶的增强子增加靶基因基因座的去甲基化。这种系统为靶基因提供了优异的去甲基化活性以改变甲基化状态。申请人首次证明,通过在复合物中包含去甲基化增强子可以显著提高包括TET去甲基化结构域的复合物的去甲基化效率。令人惊讶的是,本发明人发现,在包含增强子结构域时去甲基化效率的提高取决于:i存在的增强子蛋白质的类型;ii其中增强子结构域与去甲基化蛋白质缀合物的PUF结构域连接的方向和iii其中去甲基化增强子结构域与PUF结构域连接并连接到去甲基化结构域的方式例如,从N-末端至C-末端,缀合物可包括与连接于去甲基化增强子结构域的去甲基化结构域连接的PUF结构域,或与连接于去甲基化增强子结构域的去甲基化结构域连接的PUF结构域。申请人已经发现,其中去甲基化结构域例如,TET1催化结构域与PUF结构域的C-末端连接的复合物相对于具有与PUF结构域的N-末端连接的去甲基化结构域例如,TET1催化结构域的复合物显著更有效。申请人进一步证明,通过在去甲基化复合物中包括特定的去甲基化增强子例如,GADD45A、NEIL2可以增加C-末端连接的TET活性TET1、TET2或TET3的去甲基化活性。此外,申请人令人惊异地证明,仅特定的去甲基化增强子有效地增强TET结构域的去甲基化。事实上,如果增强子是NEIL糖基化酶例如,NEIL1、NEIL2或NEIL3,则甲基化仅在NEIL2而非NEIL1或NEIL3存在下增强,这表明特异性。本文所称的去甲基化结构域是能够使靶核酸去甲基化的蛋白质结构域。在某些实施方案中,去甲基化结构域包括去甲基化酶的催化结构域例如,TET1的催化结构域。在某些实施方案中,去甲基化结构域是去甲基化酶的催化结构域。本文提供的“去甲基化增强子结构域”、“去甲基化增强子蛋白”或“去甲基化增强子酶”是指能够相对于在不存在激活剂例如本文所述的去甲基化增强子结构域的情况下去甲基化酶或去甲基化结构域的活性或功能积极地影响例如提高去甲基化酶或去甲基化结构域的活性或功能的蛋白质、蛋白质结构域或蛋白质部分。因此,在某些实施方案中,去甲基化增强子结构域可以至少部分地部分或完全增加刺激,增加或启动激活,或活化去甲基化酶。与不存在去甲基化增强子结构域的对照相比,活性活化的增加量可以是10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更多。在某些实施方案中,活性是不存在去甲基化增强子结构域时的活性的1.5倍、2倍、3倍、4倍、5倍、10倍或更多。因此,在某些实施方案中,去甲基化增强子结构域使TET去甲基化结构域的去甲基化增加2-、3-、4-、5-、6-、7-、8-、9-、10-、11-、12-、13-、14-、15-、16-、17-、18-、19-或20-倍。在某些实施方案中,去甲基化增强子结构域增加TET去甲基化结构域的去甲基化至少2-、3-、4-、5-、6-、7-、8-、9-、10-、11-、12-、13-、14-、15-、16-、17-、18-、19-或20-倍。本文提供了可用于使细胞中的靶基因座去甲基化的去甲基化蛋白缀合物和去甲基化增强子缀合物。去甲基化蛋白缀合物包括本文所述的PUF结构域、与PUF结构域的C-末端连接的TET去甲基化结构域例如,TET1结构域、TET1催化结构域和去甲基化增强子结构域例如,NEIL2结构域或GADD45A域名。去甲基化增强子结构域可以连接到PUF结构域的N-末端或C-末端。当去甲基化增强子结构域与PUF结构域的N-末端连接时,TET去甲基化结构域和去甲基化增强子结构域不直接连接,而是通过PUF结构域连接。在去甲基化增强子结构域与PUF结构域的C-末端连接的情况中,它将PUF结构域连接到TET去甲基化结构域。换句话说,PUF结构域的C-末端与去甲基化增强子结构域连接,且去甲基化增强子结构域的C-末端与TET去甲基化结构域连接。或者,本文提供的复合物可包括去甲基化蛋白缀合物,其包括第一PUF结构域和去甲基化结构域例如,TET1结构域,其中TET去甲基化结构域与PUF结构域的C-末端连接,和去甲基化增强子缀合物包括第二PUF结构域和去甲基化增强子结构域例如,NEIL2结构域或GADD45A结构域。在某些实施方案中,去甲基化增强子结构域可操作地连接至PUF结构域的N-末端。在某些实施方案中,去甲基化增强子结构域可操作地连接至PUF结构域的C-末端。在某些实施方案中,去甲基化增强子结构域可操作地连接至第二PUF结构域的N-末端。在某些实施方案中,去甲基化增强子结构域可操作地连接至第二PUF结构域的C-末端。在某些实施方案中,去甲基化增强子结构域是生长阻滞和DNA损伤诱导αGADD45A结构域。在某些实施方案中,GADD45结构域具有SEQIDNO:85的氨基酸序列。在某些实施方案中,去甲基化增强子结构域是NEIL2结构域。在某些实施方案中,NEIL2结构域具有SEQIDNO:86的氨基酸序列。在某些实施方案中,去甲基化增强子结构域不是NEIL1结构域。在某些实施方案中,去甲基化增强子结构域不是NEIL3结构域。本文包括其实施方案提供的复合物包括去甲基化缀合物例如,去甲基化蛋白缀合物、去甲基化增强子缀合物,其分别包括i与去甲基化结构域和去甲基化增强子结构域可操作地连接的PUF结构域去甲基化蛋白缀合物,ii可操作地连接到去甲基化结构域的第一PUF结构域去甲基化蛋白缀合物或iii可操作地连接到去甲基化增强子结构域第二PUF结构域去甲基化增强子缀合物。因此,本文提供的去甲基化蛋白质缀合物包括i与去甲基化结构域和去甲基化增强子结构域连接的PUF结构域或ii与去甲基化结构域连接的第一PUF结构域。去甲基化增强子结构域包括与去甲基化增强子结构域连接的第二PUF结构域。在蛋白质缀合物是去甲基化缀合物的情况中,去甲基化结构域可操作地连接到PUF结构域的C-末端以形成蛋白质缀合物。去甲基化增强子结构域可以连接到PUF结构域的C-末端,连接到PUF结构域的N-末端,或者去甲基化增强子结构域可以结合与单独的PUF结构域即,不与去甲基化结构域连接的PUF结构域连接的多核苷酸例如,gRNA。在去甲基化增强子结构域和去甲基化结构域单独地结合多核苷酸的情况中,去甲基化结构域形成去甲基化蛋白缀合物的部分并且与第一PUF结构域连接,和去甲基化增强子结构域形成去甲基化增强子蛋白缀合物的部分并且与第二PUF结构域连接。去甲基化蛋白缀合物通过第一PUF结构域与第一PBS序列的结合来结合多核苷酸,并且去甲基化增强子蛋白缀合物通过第二PUF结构域与第二PBS序列的结合来结合多核苷酸。因此,在一个方面,提供了去甲基化复合物。该去甲基化复合物包括:a核糖核蛋白复合物,包括:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,其包含:1与靶多核苷酸序列互补的DNA靶向序列;2核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和3一个或多个PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与多核苷酸结合;和b去甲基化蛋白缀合物,包括:i具有C-末端和N-末端的PUF结构域;ii可操作地连接PUF结构域的C-末端的TET去甲基化结构域;和iii与PUF结构域的N-末端可操作地连接的去甲基化增强子结构域,以形成蛋白质缀合物,和其中去甲基化蛋白缀合物通过PUF结构域与一个或多个PBS序列结合而与核糖核蛋白复合物结合以形成去甲基化复合物。在一个方面,提供了去甲基化复合物。该去甲基化复合物包括:a核糖核蛋白复合物,其包括:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,包括:1与靶多核苷酸序列互补的DNA靶向序列;2核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和3一个或多个PUF结合位点PBS序列,其中核酸酶缺陷的RNA指的DNA核酸内切酶通过结合序列与多核苷酸结合;和b去甲基化蛋白缀合物,其包括:i具有C-末端的PUF结构域;ii具有N-末端和C-末端的去甲基化增强子结构域,其中去甲基化增强子结构域的N-末端可操作地连接到PUF结构域的C-末端;和iii与去甲基化增强子结构域的C-末端可操作地连接的TET去甲基化结构域;和其中去甲基化蛋白缀合物通过PUF结构域与一个或多个PBS序列的结合而与核糖核蛋白复合物结合以形成去甲基化复合物。在一个方面,提供了去甲基化复合物。该去甲基化复合物包括:a核糖核蛋白复合物,包括:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,包括:1与靶多核苷酸序列互补的DNA靶向序列;2核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;3第一PUF结合位点PBS序列;和4第二PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与多核苷酸结合;b去甲基化蛋白缀合物,包括:i具有C-末端的第一PUF结构域,和ii与第一PUF结构域的C-末端可操作地连接的TET去甲基化结构域,其中去甲基化蛋白质缀合物通过第一PBS序列结合第一PUF结构域而与核糖核蛋白复合物结合;和c去甲基化增强子缀合物,包括:i第二PUF结构域;和ii与第二PUF结构域可操作地连接的去甲基化增强子结构域,其中去甲基化增强子缀合物通过第二PUF结构域与第二PBS序列结合而与核糖核蛋白复合物结合以形成去甲基化复合物。在某些实施方案中,TET去甲基化结构域是TET1结构域即,TET1催化结构域、TET2结构域即TET2催化结构域或TET3结构域即,TET3催化结构域。在某些实施方案中,TET去甲基化结构域是TET1结构域。在某些实施方案中,TET去甲基化结构域是TET2结构域。在某些实施方案中,TET去甲基化结构域是TET3结构域。在某些实施方案中,TET去甲基化结构域是TET1催化结构域。在某些实施方案中,TET去甲基化结构域是TET2催化结构域。在某些实施方案中,TET去甲基化结构域是TET3催化结构域。在某些实施方案中,TET1结构域具有SEQIDNO:51的序列。在某些实施方案中,去甲基化增强子结构域是生长阻滞和DNA损伤诱导αGADD45A结构域。在某些实施方案中,GADD45结构域具有SEQIDNO:85的氨基酸序列。在某些实施方案中,去甲基化增强子结构域是NEIL2结构域。在某些实施方案中,NEIL2结构域具有SEQIDNO:86的氨基酸序列。核糖核蛋白复合物如本文提供的“核糖核蛋白复合物”是指包含核蛋白和核糖核酸的复合物。如本文提供的“核蛋白”是指能够结合核酸例如,RNA、DNA的蛋白质。在核蛋白结合核糖核酸的情况中,它被称为“核糖核蛋白”。核糖核蛋白和核糖核酸之间的相互作用可以是直接的,例如通过共价键,或是间接的,例如通过非共价键例如静电相互作用例如离子键、氢键、卤键、范德华相互作用例如偶极-偶极、偶极-诱导的偶极、伦敦分散、环堆积π效应、疏水相互作用等。在某些实施方案中,核糖核蛋白包括与核糖核酸非共价结合的RNA结合基序。例如,RNA结合基序中带正电荷的芳族氨基酸残基例如,赖氨酸残基可与RNA的阴性核酸磷酸酯骨架形成静电相互作用,从而形成核糖核蛋白复合物。核糖核蛋白的非限制性实例包括核糖体、端粒酶、RNAseP、hnRNP、CRISPR相关蛋白9Cas9和小核RNPsnRNP。核糖核蛋白可以是酶。在某些实施方案中,核糖核蛋白是核酸内切酶。在某些实施方案中,核糖核蛋白是核酸酶缺陷的RNA指导DNA核酸内切酶。因此,在某些实施方案中,核糖核蛋白复合物包括核酸酶缺陷的RNA指导DNA核酸内切酶和核糖核酸。在某些实施方案中,核酸酶缺陷的RNA指导DNA核酸内切酶包括核定位信号NLS。本文提供的核定位信号NLS提供NLS与其连接的蛋白质结构域或蛋白质的核转运,例如核酸酶缺陷的RNA指导DNA核酸内切酶。在某些实施方案中,核酸酶缺陷的RNA指导DNA核酸内切酶是核酸酶缺陷的CRISPR相关蛋白9dCas9。在某些实施方案中,核酸酶缺陷的RNA指导DNA核酸内切酶是来自普氏菌和弗朗西斯氏菌1Cpf1的核酸酶缺陷的规律间隔成簇短回文重复序列。多核苷酸本文提供的多核苷酸包括1与靶多核苷酸序列互补的DNA靶向序列,2核酸酶缺陷的RNA指导DNA核酸内切酶例如,dCas9的结合序列,和3一个或多个PUF结合位点PBS序列例如,第一3和第二4PBS序列。在某些实施方案中,复合物包括与多核苷酸结合的dCas9,从而形成核糖核蛋白复合物。在某些实施方案中,多核苷酸是核糖核酸。在某些实施方案中,多核苷酸是指导RNA。如本文提供的“指导RNA”或“gRNA”是指能够结合核蛋白的核糖核苷酸序列,从而形成核糖核蛋白复合物。在某些实施方案中,多核苷酸例如,gRNA是单链核糖核酸。在某些实施方案中,多核苷酸例如,gRNA的长度为10、20、30、40、50、60、70、80、90、100或更多个核酸残基。在某些实施方案中,多核苷酸例如,gRNA的长度为10至30个核酸残基。在某些实施方案中,多核苷酸例如,gRNA的长度为20个核酸残基。在某些实施方案中,多核苷酸例如,gRNA的长度可以是至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个核酸残基或糖残基。在某些实施方案中,多核苷酸例如,gRNA长度为5至50、10至50、15至50、20至50、25至50、30至50、35至50、40至50、45至50、50到75、10到75、15到75、20到75、25到75、30到75、35到75、40到75、45到75、50到75、55到75、60到75、65到75、70至75、5至100、10至100、15至100、20至100、25至100、30至100、35至100、40至100、45至100、50至100、55至100、60至100、65至100、70至100、75至100、80至100、85至100、90至100、95至100或更多个残基。在某些实施方案中,多核苷酸例如,gRNA的长度为10至15、10至20、10至30、10至40或10至50个残基。在某些实施方案中,多核苷酸的转录在组成型启动子例如CMV启动子或Ubc启动子或诱导型启动子例如四环素反应性启动子或类固醇反应性启动子的控制下。在某些实施方案中,多核苷酸是载体。在某些实施方案中,编码多核苷酸用于本发明的方法中的载体在来自哺乳动物人;非人灵长类动物;非人哺乳动物;啮齿动物如小鼠、大鼠、仓鼠、豚鼠;家畜哺乳动物如猪、绵羊、山羊、马、骆驼、牛;或宠物哺乳动物如猫或狗;鸟;鱼;昆虫;蠕虫;酵母或细菌的细胞中是有活性的。在某些实施方案中,载体是质粒、病毒载体如腺病毒、逆转录病毒或慢病毒载体,或AAV载体或转座子如piggyBac转座子。载体可以瞬时转染到宿主细胞中,或通过感染或转座整合到宿主基因组中。DNA-靶向序列多核苷酸包括与靶位点例如,靶多核苷酸序列互补的核苷酸序列,其在本文中称为“DNA-靶向序列”。DNA靶向序列可介导核糖核蛋白复合物与互补靶多核苷酸序列的结合,从而提供核糖核蛋白复合物的序列特异性。因此,在某些实施方案中,多核苷酸例如,gRNA或其部分与靶多核苷酸序列互补。在某些实施方案中,多核苷酸例如,gRNA结合靶多核苷酸序列。在某些实施方案中,多核苷酸的互补序列具有与靶多核苷酸序列的50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。在某些实施方案中,DNA靶向序列的互补序列具有与靶多核苷酸序列的50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。应注意,DNA靶向序列可与靶多核苷酸序列100%互补或不与靶多核苷酸序列100%互补。在某些实施方案中,DNA靶向序列在8-25个核苷酸nt、12-22个核苷酸、14-20nt、16-20nt、18-20nt,或者8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25nt上与靶多核苷酸序列互补。在某些实施方案中,互补区包含12-22nt的连续区段,优选在DNA靶向序列的3'端。在某些实施方案中,DNA靶向序列的5'端与靶多核苷酸序列具有多达8个核苷酸错配。在某些实施方案中,DNA结合序列与靶多核苷酸序列50、55、60、65、70、75、80、85、90、95或100%互补。在相关的实施方案中,与互补靶多核苷酸序列相比,DNA靶向序列的3'端存在不超过15个核苷酸匹配,并且复合物中核酸酶缺陷的RNA指导DNA核酸内切酶是核酸酶缺陷乏野生型Cas9蛋白核酸酶缺陷型wtCas9蛋白,其在这种情况下结合但不切割靶DNA例如,dCas9蛋白。在某些实施方案中,核酸酶缺陷的RNA指导DNA核酸内切酶是来自普氏菌和弗朗西斯氏菌1Cpf1的核酸酶缺陷的规律间隔成簇短回文重复序列。DNA靶向序列在功能上与CRISPRCas复合物系统的crRNA或指导RNA或gRNA相似或等同。然而,在本发明的情况中,DNA靶向序列可以不源自任何特定的crRNA或gRNA,而是可以基于靶多核苷酸序列的序列任意地设计。DNA靶向序列包括与靶DNA或靶DNA的互补链内的特定序列互补的核苷酸序列。换句话说,DNA靶向序列通过杂交即,碱基配对以序列特异性方式与靶DNA的靶多核苷酸序列相互作用。因此,DNA靶向序列的核苷酸序列可以变化,并且它决定靶DNA内所述多核苷酸和靶DNA将相互作用的位置。DNA靶向序列可以修饰或设计例如,通过基因工程以与靶DNA内的任何所需序列杂交。在某些实施方案中,靶多核苷酸序列紧邻互补链的PAM原型间隔区相邻基序序列其可以是5'-CCN-3',其中N是任何DNA核苷酸的3'侧。也就是说,在该实施方案中,靶多核苷酸序列的互补链紧邻为5'-NGG-3'的PAM序列的5'侧,其中N是任何DNA核苷酸。在相关实施方案中,互补链的PAM序列与核酸酶缺陷型wtCas9蛋白或dCas9匹配。DNA靶向序列可具有12个核苷酸至100个核苷酸的长度。例如,DNA靶向序列可具有12个核苷酸nt至80nt,12nt至50nt,12nt至40nt,12nt至30nt,12nt至25nt,12nt至20nt,或12nt至19nt的长度。例如,DNA靶向序列的长度可以为19nt至20nt,19nt至25nt,19nt至30nt,19nt至35nt,19nt至40nt,19nt至45nt,19nt至50nt,19nt至60nt,19nt至70nt,19nt至80nt,19nt至90nt,19nt至100nt,20nt至25nt,20nt至30nt,20nt至35nt,20nt至40nt,20nt至45nt,20nt至50nt,20nt至60nt,20nt至20nt70nt,20nt至80nt,20nt至90nt,或20nt至100nt。与靶DNA的靶多核苷酸序列互补的DNA靶向序列的核苷酸序列可具有至少12nt的长度。例如,与靶DNA的靶多核苷酸序列互补的DNA靶向序列可具有至少12nt,至少15nt,至少18nt,至少19nt,至少20nt,至少25nt,至少30nt,至少35nt或至少40nt的长度。例如,与靶DNA的靶多核苷酸序列互补的DNA靶向序列可具有12个核苷酸nt至80nt,12nt至50nt,12nt至45nt,12nt至40nt,12nt至35nt,12nt至30nt,12nt至25nt,12nt至20nt,12nt至19nt,19nt至20nt,19nt至25nt,19nt至30nt,19nt至35nt,19nt至40nt,19nt至45nt,19nt至50nt,19nt至60nt,20nt至25nt,20nt至30nt,20nt至35nt,20nt至40nt,20nt至45nt,20nt至50nt,或20nt至60nt的长度。与靶DNA的靶多核苷酸序列互补的DNA靶向序列的核苷酸序列可具有至少12nt的长度。在一些情况下,与靶DNA的靶多核苷酸序列互补的DNA靶向序列长度为20个核苷酸。在一些情况下,与靶DNA的靶多核苷酸序列互补的DNA靶向序列长度为19个核苷酸。DNA靶向序列与靶DNA的靶多核苷酸序列之间的百分互补性可为50%例如,至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少97%,至少98%,至少99%或100%。在一些情况下,DNA靶向序列和靶多核苷酸序列之间的百分互补性在靶多核苷酸序列的七或八个连续的最5'-核苷酸上是100%。在一些情况下,DNA靶向序列和靶多核苷酸序列之间的百分互补性在20个连续核苷酸上为至少60%。在一些情况下,DNA靶向序列和靶多核苷酸序列之间的百分互补性在靶多核苷酸序列的7、8、9、10、11、12、13或14个连续的最5'-核苷酸即,DNA靶向序列的7、8、9、10、11、12、13或14个连续的最3'核苷酸上是100%,并且在其余部分上低至0%。在这种情况下,DNA靶向序列可以被认为长度分别是7、8、9、10、11、12、13或14个核苷酸。靶多核苷酸序列如本文提供的“靶多核苷酸序列”是由细胞表达的核酸序列。在某些实施方案中,靶多核苷酸序列是外源核酸序列。在某些实施方案中,靶多核苷酸序列是内源核酸序列。在某些实施方案中,靶多核苷酸序列形成细胞基因的部分。在某些实施方案中,靶多核苷酸序列是基因的部分。在某些实施方案中,靶多核苷酸序列是Sox基因的部分。在某些实施方案中,靶多核苷酸序列是转录调控序列的部分。在某些实施方案中,靶多核苷酸序列是启动子、增强子或沉默子的部分。在某些实施方案中,靶多核苷酸序列是高甲基化核酸序列。在某些实施方案中,靶多核苷酸序列是高甲基化的CpG序列。在某些实施方案中,靶多核苷酸序列是hMLH1启动子的部分。在某些实施方案中,靶序列是RNA。在某些实施方案中,靶序列是DNA。在本文的描述中,当靶序列是DNA例如基因组DNA时,第一区段通常被称为“DNA靶向序列”。在其中靶序列是RNA的相关实施方案中,本文中以下的描述通常也适用,除了对“DNA靶向序列”的提及用“RNA靶向序列”替换,以避免繁冗。也就是说,多核苷酸包括与靶多核苷酸序列DNA或RNA互补的核苷酸序列。在某些实施方案中,三个区段1-3以该顺序从5'至3'排列。在某些实施方案中,三个区段1-4以该顺序从5'至3'排列。在某些实施方案中,本发明的多核苷酸可以是单个RNA分子单RNA多核苷酸,其可以包括“单指导RNA”或“sgRNA”。在另一实施方案中,本发明的多核苷酸包括两个RNA分子例如,通过在结合序列处的杂交而连接在一起例如,核酸酶缺陷型wtCas9蛋白-或dCas9-结合序列。因此,所述多核苷酸是包括性的,指两分子多核苷酸和单分子多核苷酸例如sgRNA两者。在某些实施方案中,靶多核苷酸序列在启动子序列处、其附近或其内。在某些实施方案中,靶多核苷酸序列在CpG岛内。在某些实施方案中,已知靶多核苷酸序列与以DNA低甲基化或超甲基化为特征的疾病或病症相关。在某些实施方案中,靶多核苷酸序列在肿瘤抑制基因或致癌基因内,例如在肿瘤抑制基因或癌基因的转录调控序列元件内。在某些实施方案中,靶多核苷酸序列紧邻靶多核苷酸序列的PAM原型间隔区相邻基序序列的3'侧。例如,在某些实施方案中,靶多核苷酸序列的PAM序列是5'-CCN-3',其中N是任何DNA核苷酸。在其他实施方案中,靶多核苷酸序列的PAM序列与待使用的特定核酸酶缺陷型wtCas9蛋白或dCas9蛋白或同源物或直系同源物匹配。如本领域所知,为使核酸酶缺陷型wtCas9蛋白或dCas9蛋白成功结合DNA,基因组DNA中的靶多核苷酸序列必须与指导RNA序列互补,并且必须紧接正确的原型间隔区相邻基序或PAM序列。PAM序列存在于靶多核苷酸序列中但不存在于指导RNA序列中。具有正确的靶多核苷酸序列然后是PAM序列的任何DNA序列将被核酸酶缺陷型wtCas9蛋白或dCas9蛋白结合。在某些实施方案中,PAM序列是国际申请PCTUS2016021491并且公开为WO2016148994A8中公开的任何PAM序列,其通过引用并入本文并用于所有目的。在实施方案中,多核苷酸例如,gRNA是靶多核苷酸序列的50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%。在某些实施方案中,多核苷酸例如,gRNA与细胞基因的序列50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%互补。在某些实施方案中,多核苷酸例如,gRNA结合细胞基因序列。结合序列在某些实施方案中,复合物包括通过结合多核苷酸的结合序列而与多核苷酸结合的dCas9,且由此形成核糖核蛋白复合物。在某些实施方案中,结合序列形成发夹结构。在某些实施方案中,结合序列的长度为30-100nt,35-50nt,37-47nt或42nt。示例性结合序列是SEQIDNO:6GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTA的序列。另一个示例性结合序列是SEQIDNO:7GTTTAAGAGCTATGCTGGAAACAGCATAGCAAGTTTAAATAAGGCTA的序列。在某些实施方案中,结合序列包括SEQIDNO:6的序列。在某些实施方案中,结合序列包括SEQIDNO:7的序列。在某些实施方案中,结合序列是SEQIDNO:6的序列。在某些实施方案中,结合序列是SEQIDNO:7的序列。所述多核苷酸的结合序列蛋白质结合区段或蛋白质结合序列与修饰的dCas9蛋白例如,核酸酶缺陷的切口酶或dCas9其具有降低的核酸内切酶活性或缺乏核酸内切酶活性结合。为简单起见,可以与修饰的Cas9蛋白例如,dCas9蛋白结合的结合序列蛋白质结合区段或蛋白质结合序列在本文中可以简称为“Cas9结合序列”或“结合序列”。然而,应当理解,当本发明的结合序列Cas9结合序列与dCas9结合时,其不阻止与wtCas9或Cas9切口酶的结合。在某些实施方案中,本发明的结合序列Cas9结合序列与dCas9以及wtCas9和或Cas9切口酶结合。结合序列Cas9结合序列与Cas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白相互作用或结合,并且它们一起结合由DNA靶向序列识别的靶多核苷酸序列。结合序列Cas9结合序列包括两个互补的核苷酸延伸片段,它们彼此杂交以形成双链RNA双链体dsRNA双链体。这两个互补的核苷酸延伸片段可以通过称为接头或接头核苷酸的插入核苷酸共价连接例如,在单分子多核苷酸的情况下,并杂交以形成结合序列Cas9结合序列的双链RNA双链体dsRNA双链体,或“Cas9-结合发夹”,因此产生茎-环结构。或者,在一些实施方案中,两个互补的核苷酸延伸片段可以不共价连接,而是通过互补序列之间的杂交保持在一起例如,在本发明的双分子多核苷酸的情况下。结合序列Cas9结合序列可具有10个核苷酸至100个核苷酸的长度,例如10个核苷酸nt至20nt,20nt至30nt,30nt至40nt,40nt至50nt,50nt至60nt,60nt至70nt,70nt至80nt,80nt至90nt,或90nt至100nt。例如,Cas9-结合序列可以具有15个核苷酸nt至80nt,15nt至50nt,15nt至40nt,15nt至30nt,37nt至47nt例如,42nt,或15nt至25nt的长度。结合序列Cas9结合序列的dsRNA双链体可具有6个碱基对bp至50bp的长度。例如,结合序列Cas9结合序列的dsRNA双链体可以具有6bp至40bp,6bp至30bp,6bp至25bp,6bp至20bp,6bp至15bp,8bp至40bp,8bp至30bp,8bp至25bp,8bp至20bp或8bp至15bp的长度。例如,结合序列Cas9结合序列的dsRNA双链体可以具有8bp至10bp,10bp至15bp,15bp至18bp,18bp至20bp,20bp至25bp,25bp至30bp,30bp至35bp,35bp至40bp,或40bp至50bp的长度。在一些实施方案中,结合序列Cas9结合序列的dsRNA双链体具有36个碱基对的长度。杂交以形成结合序列Cas9结合序列的dsRNA双链体的核苷酸序列之间的百分互补性可以是至少60%。例如,杂交以形成结合序列Cas9结合序列的dsRNA双链体的核苷酸序列之间的百分互补性可以是至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少98%或至少99%。在一些情况下,杂交以形成结合序列Cas9结合序列的dsRNA双链体的核苷酸序列之间的百分互补性是100%。在某些实施方案中,多核苷酸还包括将DNA靶向序列与结合序列Cas9结合序列连接的接头序列。接头可具有3个核苷酸至100个核苷酸的长度。例如,接头可具有3个核苷酸nt至90nt,3个核苷酸nt至80nt,3个核苷酸nt至70nt,3个核苷酸nt至60nt,来自3个核苷酸nt至50nt,3个核苷酸nt至40nt,3个核苷酸nt至30nt,3个核苷酸nt至20nt或3个核苷酸nt至10nt的长度。例如,接头可以具有3nt至5nt,5nt至10nt,10nt至15nt,15nt至20nt,20nt至25nt,25nt至30nt,30nt至35nt,35nt至40nt,40nt至50nt,50nt至60nt,60nt至70nt,70nt至80nt,80nt至90nt,或90nt至100nt的长度。在一些实施方案中,接头是4nt。可以包括在合适的结合序列Cas9结合序列,即Cas9柄中的核苷酸序列的非限制性实例在WO2013176772的SEQIDNO:563-682中列出参见,例如,WO2013176772的图8和9,其全部内容通过引用并入本文并用于所有目的。在一些情况下,合适的结合序列Cas9结合序列包括与上述任何一个序列相差1、2、3、4或5个核苷酸的核苷酸序列。PBS序列如本文提供的术语“PBS”或“PUF结合位点”是指由Pumiliofem-3mRNA结合因子PUF结合的位点。PUF结合位点PBS可以形成指导RNA的部分并且提供用于本文提供的PUF蛋白或PUF结构域例如,PUFa、PUFb、PUFc或其功能片段与所述指导RNA的结合。PUF结合位点包括作为PBS的特征的核酸序列即,PBS序列或PUF结合位点序列,并且可以直接被PUF蛋白结合。本文提供的多核苷酸例如,gRNA还包括一个或多个PUF结合位点PBS序列。在一些方面,去甲基化复合物包括与不同于去甲基化结构域的PUF结构域连接的去甲基化增强子结构域。因此,去甲基化结构域可以通过第一PUF结构域结合第一PBS序列而与多核苷酸结合,并且去甲基化增强子结构域可以通过第二PUF结构域结合第二PBS序列而与多核苷酸结合。第一和第二PBS序列可以不同或可以相同。在某些实施方案中,一个或多个PBS序列例如,第一或第二PBS序列含有8个核苷酸的长度。在某些实施方案中,一个或多个PBS序列例如,第一或第二PBS序列是相同的。在某些实施方案中,多核苷酸包含1至50个PBS序列。在某些实施方案中,一个或多个PBS序列例如,第一或第二PBS序列包含SEQIDNO:1的核苷酸序列。在国际申请PCTUS2016021491和公布为WO2016148994A8其全部内容并入本文作为参考并用于所有目的中公开的任何一种PBS序列例如,第一或第二PBS序列预期用于本文提供的组合物和方法。在某些实施方案中,一个或多个PBS序列例如,第一或第二PBS序列中的每一个具有8个核苷酸。一个示例性PBS序列可以具有SEQIDNO:8的序列5’-UGUAUGUA-3’,其可以被PUF结构域PUF3-2结合。另一个示例性PBS可以具有SEQIDNO:9的序列5’-UUGAUAUA-3’,其可以被PUF结构域PUF6-27-2结合。另外的PBS序列和相应的PUF结构域描述于国际申请PCTUS2016021491中并公布为WO2016148994A8,其通过引用整体并入本文并用于所有目的。本发明的多核苷酸可具有超过一个拷贝的PBS序列。在某些实施方案中,多核苷酸包含1、2、3、4、5、10、15、20、25、30、35、40、45、46、47、48、49或50个拷贝的PBS序列,如5、6、7、8、9、10、11、12、13、14或15个拷贝的PBS序列。在某些实施方案中,PBS序列拷贝数的范围是L至H,其中L是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35或40中的任何一个,且其中H是2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、80、90或100中的任何一个,只要H大于L。每个PBS序列可以相同或不同。在某些实施方案中,多核苷酸包括1、2、3、4、5、10、15、20、25、30、35、40、45、46、47、48、49或50个拷贝,或者1-50、2-45、3-40、5-35、5-10、10-20个拷贝的相同或不同的PBS序列。在某些实施方案中,多核苷酸包含5-15个拷贝的PBS序列,或者5-14个拷贝,5-13个拷贝,5-12个拷贝,5-11个拷贝,5-10个拷贝或5-9个拷贝的PBS序列。在某些实施方案中,调节gRNA-PBS序列的量和或转染或表达的蛋白质缀合物甲基化或去甲基化蛋白缀合物的量以使PBSPUF结构域结合最大化。例如,这可以通过用更强的启动子或使用诱导型启动子如Dox诱导型启动子增加PUF结构域的表达来实现。在某些实施方案中,优化PBS序列和或间隔区序列之间的间距以提高系统效率。例如,间距优化可以受特定蛋白质缀合物甲基化或去甲基化蛋白缀合物的影响,并且可能在作为单个蛋白质发挥作用的蛋白质缀合物甲基化或去甲基化蛋白缀合物和可能需要足够靠近定位以起作用例如,蛋白质复合物的那些蛋白质缀合物甲基化或去甲基化蛋白质缀合物之间不同。在某些实施方案中,一个或多个间隔区分隔两个相邻的PBS序列。间隔区可具有3个核苷酸至100个核苷酸的长度。例如,间隔区可具有3个核苷酸nt至90nt,3个核苷酸nt至80nt,3个核苷酸nt至70nt,3个核苷酸nt至60nt,3个核苷酸nt至50nt,3个核苷酸nt至40nt,3个核苷酸nt至30nt,3个核苷酸nt至20nt或3个核苷酸nt至10nt的长度。例如,间隔区的长度可以为3nt至5nt,5nt至10nt,10nt至15nt,15nt至20nt,20nt至25nt,25nt至30ntnt,30nt至35nt,35nt至40nt,40nt至50nt,50nt至60nt,60nt至70nt,70nt至80nt,80nt至90nt,或90nt至100nt。在一些实施方案中,间隔区是4nt。在某些实施方案中,PBS序列包括SEQIDNO:1、SEQIDNO:8、SEQIDNO:9、SEQIDNO:10、SEQIDNO:11、SEQIDNO:12、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17或SEQIDNO:27的序列。在某些实施方案中,PBS序列是SEQIDNO:1、SEQIDNO:8、SEQIDNO:9、SEQIDNO:10、SEQIDNO:11、SEQIDNO:12、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17或SEQIDNO:27的序列。在某些实施方案中,第一或第二PBS序列含有8个核苷酸的长度。在某些实施方案中,第一或第二PBS序列包括SEQIDNO:1的核苷酸序列。蛋白质缀合物PUF结构域已知PUF蛋白以果蝇Pumilio和秀丽隐杆线虫fern-3结合因子命名参与介导mRNA稳定性和翻译。这些蛋白质含有称为PUF结构域的独特RNA结合结构域。RNA结合的PUF结构域,如人Pumilio1蛋白的RNA结合PUF结构域在此也称为PUM,包含以反平行方式结合连续碱基的8个重复序列每个重复序列称为PUF基序或PUF重复,每个重复序列识别单一碱基-即,PUF重复序列R1至R8分别识别核苷酸N8至N1。例如,PUM由8个串联重复序列组成,每个重复序列由折叠成由α螺旋组成的紧密包装的结构域的34个氨基酸组成。本文包括其实施方案提供的复合物包括去甲基化蛋白缀合物例如,去甲基化蛋白质缀合物、去甲基化增强子缀合物,其包括i与去甲基化结构域和去甲基化增强子结构域可操作地连接的PUF结构域或ii分别可操作地连接至去甲基化结构域的第一PUF结构域和可操作地连接至去甲基化增强子结构域的第二PUF结构域。在蛋白质缀合物是去甲基化缀合物的情况中,去甲基化结构域可操作地连接至PUF结构域的C-末端以形成蛋白质缀合物。去甲基化增强子结构域可以连接至PUF结构域的C-末端,至PUF结构域的N-末端,或者去甲基化增强子结构域可以结合连接到单独的PUF结构域即,不与去甲基化结构域连接的PUF结构域的多核苷酸例如,gRNA。在去甲基化增强子结构域和去甲基化结构域分别结合多核苷酸的情况中,去甲基化结构域形成去甲基化蛋白缀合物的部分并且与第一PUF结构域连接,并且去甲基化增强子结构域形成去甲基化增强子蛋白缀合物的部分并且与第二PUF结构域连接。去甲基化蛋白缀合物通过第一PUF结构域与第一PBS序列的结合来结合多核苷酸,并且去甲基化增强子蛋白质缀合物通过第二PUF结构域与第二PBS序列的结合来结合多核苷酸。如本文所用,术语“PUF结构域”是指野生型或天然存在的PUF结构域,以及基于衍生自天然或现有PUF结构域如原型人Pumilio1PUF结构域的PUF同源结构域。本发明的PUF结构域特异性结合RNA序列例如,8-聚RNA序列,其中PUF结构域和RNA序列之间的总体结合特异性通过PUF结构域内的每个PUF基序PUF重复序列和相应单RNA核苷酸之间的序列特异性结合来定义。在本发明范围内还包括所述PUF结构域或其融合体的功能性变体。如本文所用的术语“功能性变体”是指具有与亲本PUF结构域的实质或显著序列同一性或相似性的PUF结构域,该功能性变体保留为其变体的PUF结构域的生物学活性例如,在结合亲和力方面保留与亲本PUF结构域相似程度、相同程度或更高程度的识别靶RNA的能力,和或具有与亲本PUF结构域基本上同样或相同的结合特异性。功能性变体PUF结构域可以例如与亲本PUF结构域的氨基酸序列至少30%、50%、75%、80%、90%、98%或更多相同。功能性变体可以例如包含亲本PUF结构域的氨基酸序列,其具有至少一个保守氨基酸置换,例如PUF结构域的支架即,不与RNA相互作用的氨基酸中的保守氨基酸置换。或者或另外地,功能性变体可包含亲本PUF结构域的氨基酸序列,其具有至少一个非保守氨基酸置换。在这种情况下,优选的是非保守氨基酸置换不干扰或抑制功能性变体的生物活性。非保守氨基酸取代可以增强功能性变体的生物活性,使得功能性变体与亲本PUF结构域相比的生物活性增加,或者可以将PUF结构域的稳定性改变至期望水平例如,由于支架中氨基酸的置换。PUF结构域可基本上由本文所述的一个或多个特定氨基酸序列组成,使得其他组分例如,其他氨基酸不会实质上改变功能性变体的生物学活性。在某些实施方案中,PUF结构域是Pumilio同源结构域PU-HUD。在特定实施方案中,PU-HUD是人Pumilio1结构域。在某些实施方案中,PUF结构域具有公开为WO2016148994A8的国际申请PCTUS2016021491、公开为WO2011160052A2的国际申请PCTUS2011040933及Spassov&Jurecic“CloningandcomparativesequenceanalysisofPUM1andPUM2genes,humanmembersofthePumiliofamilyofRNA-bindingproteins,”Gene,299:195-204,October2002中公开的任何一种PUF结构域的序列,其全部内容且为所有目的通过引用并入本文。在某些实施方案中,PUF结构域包括PUFa结构域、PUFb结构域、PUFc结构域或PUFw结构域。在某些实施方案中,PUFa结构域具有SEQIDNO:2的氨基酸序列。在某些实施方案中,PUFb结构域具有SEQIDNO:3的氨基酸序列。在某些实施方案中,PUFc结构域具有SEQIDNO:4的氨基酸序列。在某些实施方案中,PUFw结构域具有SEQIDNO:5的氨基酸序列。在某些实施方案中,第一PUF结构域是PUFa结构域。在某些实施方案中,PUFa结构域具有SEQIDNO:2的序列。在某些实施方案中,第二PUF结构域是PUFc结构域。在某些实施方案中,PUFc结构域具有SEQIDNO:4的序列。在某些实施方案中,第一或第二PUF结构域包括PUFa结构域、PUFb结构域、PUFc结构域或PUFw结构域。在某些实施方案中,第一或第二PUFa结构域具有SEQIDNO:2的氨基酸序列。在某些实施方案中,第一或第二PUFb结构域具有SEQIDNO:3的氨基酸序列。在某些实施方案中,第一或第二PUFc结构域具有SEQIDNO:4的氨基酸序列。在某些实施方案中,第一或第二PUFw结构域具有SEQIDNO:5的氨基酸序列。所述多核苷酸包括一个或多个串联序列,其中每个可以被特定PUF结构域下文特异性识别和结合。由于PUF结构域可以基于PUF结构域的单个PUF基序与它们识别的单个RNA核苷酸之间的核苷酸特异性相互作用而工程化以结合实质上任何PBS序列,该PBS序列可以是结合其相应PUF结构域的任何设计的序列。在某些实施方案中,本发明的PBS具有8聚的核苷酸长度。在其他实施方案中,本发明的PBS具有5、6、7、8、9、10、11、12、13、14、15、16或更多个RNA核苷酸。在某些实施方案中,本发明的PBS具有SEQIDNO:10的序列5'-UGUAUAUA-3',并结合wt人Pumilio1PUF结构域。在某些实施方案中,本发明的PBS序列具有SEQIDNO:8的序列5'-UGUAUGUA-3',并结合PUF结构域PUF3-2。在某些实施方案中,本发明的PBS序列具有SEQIDNO:9的序列5'-UUGAUAUA-3',并结合PUF结构域PUF6-27-2。在某些实施方案中,本发明的PBS序列具有SEQIDNO:11的序列5’-UGGAUAUA-3’,并结合PUF结构域PUF6-2。在某些实施方案中,本发明的PBS序列具有SEQIDNO:12的序列5’-UUUAUAUA-3’,并结合PUF结构域PUF7-2。在某些实施方案中,本发明的PBS序列具有SEQIDNO:13的序列5’-UGUGUGUG-3’,并结合PUF结构域PUF531。在某些实施方案中,本发明的PBS序列具有SEQIDNO:14的序列5’-UGUAUAUG-3’,并结合PUF结构域PUF1-1。在某些实施方案中,本发明的PBS序列具有SEQIDNO:12的序列5’-UUUAUAUA-3’或SEQIDNO:15的序列5’-UAUAUAUA-3’,并结合PUF结构域PUF7-1。在某些实施方案中,本发明的PBS序列具有SEQIDNO:16的序列5’-UGUAUUUA-3’,并结合PUF结构域PUF3-1。在某些实施方案中,本发明的PBS序列具有SEQIDNO:17的序列5’-UUUAUUUA-3’,并结合PUF结构域PUF7-23-1。在实施方案中,PUF结构域PUF3-2具有SEQIDNO:18的序列。在某些实施方案中,PUF结构域PUF6-27-2具有SEQIDNO:19的序列。在某些实施方案中,PUF结构域PUF531具有SEQIDNO:22的序列。在某些实施方案中,PUF结构域包括SEQIDNO:18、SEQIDNO:19、SEQIDNO:22、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30或SEQIDNO:31的序列。在某些实施方案中,PUF结构域是SEQIDNO:18、SEQIDNO:19、SEQIDNO:22、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30或SEQIDNO:31的序列。申请人已经产生了65,536个8聚PBS序列及其相应的PUF结构域序列见下文,其可以结合特定的PBS序列。申请人还建立了python脚本来检索结合给定8-聚PBS序列的65,536个单独PUF结构域序列中的任一个。例如,对于8聚UUGAUGUASEQIDNO:27,一种可能的PUF结构域序列可以是SEQIDNO:28:GRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGCRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGPUF3-2SEQIDNO:18PUF3-2SEQIDNO:18在PUF重复序列3中具有两个点突变C935SQ939E,并识别具有NRE的6位处的突变的同源RNAA6G;SEQIDNO:275’-UGUAUGUA-3’。PUF6-27-2SEQIDNO:19PUF6-27-2SEQIDNO:19分别在重复序列6和7中具有双重点突变N1043SQ1047E和S1079NE1083Q,并识别在NRE的2和3位具有两个突变的同源RNA序列GUUG;SEQIDNO:95’-UUGAUAUA-3’。相关的PUF6-2在重复序列6中具有点突变N1043SQ1047E,并识别在NRE的3位具有突变的同源RNA序列SEQIDNO:115’-UGGAUAUA-3’。另一个相关的PUF7-2在重复序列7中具有点突变S1079NE1083Q,并且识别在NRE的第2位具有突变的同源RNA序列SEQIDNO:125’-UUUAUAUA-3’。PUF531SEQIDNO:22PUF结构域PUF531SEQIDNO:22在野生型PUF重复序列1、3和5中具有突变Q867EQ939EC935SQ1011EC1007S,并识别SEQIDNO:13的序列5’-UGUGUGUG-3’。与野生型PUFRNA相比,PUF531可以以非常高的亲和力识别其新靶序列。另一种修饰的PUF结构域PUF1-1在PUF重复序列1中具有一个点突变Q867E,并且识别在NRE的8位处具有突变的同源RNAA8G;SEQIDNO:145’-UGUAUAUG-3’。再另一种修饰的PUF结构域PUF7-1在PUF重复序列7中具有一个点突变E1083Q,并且识别在NRE的2位处具有突变的同源RNAG2U;SEQIDNO:125’-UUUAUAUA-3’;或G2A;SEQIDNO:155’-UAUAUAUA-3’。再另一种修饰的PUF结构域PUF3-1在PUF重复序列3中具有一个点突变C935N,并且识别在NRE的6位处具有突变的同源RNAA6U;SEQIDNO:165’-UGUAUUUA-3’。进一步修饰的PUF7-23-1在重复序列7和3中具有点突变C935NS1079NE1083Q,并且识别具有在NRE的2和6位处的突变的同源RNA序列SEQIDNO:175’-UUUAUUUA-3’。在实施方案中,PUF结构域具有SEQIDNO:29的序列。SEQIDNO:30SEQIDNO:31本文提供的去甲基化结构域例如,TET1结构域或甲基化结构域例如,Dnmt3a结构域或去甲基化增强子结构域例如,NEIL2结构域、GADD45A结构域可以与本文包括其实施方案提供的PUF结构域连接。或者,本文提供的去甲基化结构域例如,TET1结构域或甲基化结构域例如,Dnmt3a结构域或去甲基化增强子结构域例如,NEIL2结构域、GADD45A结构域可以与核酸酶缺陷的RNA指导DNA核酸内切酶例如,dCas9连接。当本文提供的去甲基化结构域或去甲基化增强子结构域与核酸酶缺陷的RNA指导DNA核酸内切酶例如,dCas9直接连接融合时,化学接头可以将去甲基化结构域或甲基化结构域与核酸酶缺陷的RNA指导DNA核酸内切酶连接。在某些实施方案中,化学接头是肽接头。在某些实施方案中,化学接头是聚甘氨酸接头。在某些实施方案中,去甲基化结构域或去甲基化增强子结构域与核酸酶缺陷的RNA指导DNA核酸内切酶例如dCas9的C-末端连接。在某些实施方案中,去甲基化结构域或去甲基化增强子结构域与核酸酶缺陷的RNA指导DNA核酸内切酶例如,dCas9的N-末端连接。当本文提供的去甲基化结构域或去甲基化增强子结构域与核酸酶缺陷的RNA指导DNA内切核酸酶例如,dCas9直接连接融合时,去甲基化结构域或去甲基化增强子结构域和核酸酶缺陷的RNA指导DNA内切核酸酶例如,dCas9形成dCas9-去甲基化结构域缀合物或dCas9-去甲基化增强子结构域缀合物。在某些实施方案中,dCas9-去甲基化结构域例如,TET1结构域缀合物具有SEQIDNO:52的序列。在某些实施方案中,dCas9-去甲基化结构域缀合物具有SEQIDNO:53的序列。在某些实施方案中,dCas9-甲基化例如,Dnmt3a结构域缀合物具有SEQIDNO:59的序列。在某些实施方案中,dCas9-甲基化结构域缀合物具有SEQIDNO:60的序列。在某些实施方案中,dCas9-甲基化结构域缀合物具有SEQIDNO:61的序列。在某些实施方案中,dCas9-甲基化结构域缀合物具有SEQIDNO:62的序列。在某些实施方案中,dCas9-甲基化结构域缀合物具有SEQIDNO:63的序列。在某些实施方案中,dCas9-甲基化结构域缀合物具有SEQIDNO:64的序列。本文提供的复合物可包括可操作地连接至PUF结构域或核酸酶缺陷的RNA指导DNA核酸内切酶例如,dCas9蛋白的另外的生物活性结构域。因此,根据本发明,异源多肽也称为“融合伴体”可以与本文包括其实施方案提供的去甲基化或去甲基化增强子蛋白质缀合物的PUF结构域融合,其结合所述多核苷酸上的至少一个PBS。此外,如果需要,相同或不同的融合伴体也可以任选地与核酸酶缺陷的RNA指导DNA核酸内切酶例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白融合。因此,如本文所述,除非特别声明排除,否则任何融合伴体旨在与本文包括其实施方案提供的去甲基化或去甲基化增强子蛋白缀合物的PUF结构域融合,并且任选地还与核酸酶缺陷的RNA指导DNA内切核酸酶例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白融合。与PUF结构域融合的融合伴体可以与融合于核酸酶缺陷的RNA指导DNA核酸内切酶例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白的任选融合伴体相同或不同下文。在某些实施方案中,融合伴体是生物活性部分。在某些实施方案中,融合伴体是可检测的部分或治疗部分。融合伴体可以表现出活性例如,酶活性。合适的融合伴体包括但不限于提供甲基转移酶活性、去甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷化活性、SUMOylating活性、deSUMOylating活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性或去肉豆蔻酰化活性的多肽,其任何一种可以针对直接修饰DNA例如,DNA的甲基化或修饰DNA相关多肽例如,组蛋白或DNA结合蛋白。另外的融合伴体可包括各种荧光蛋白、多肽、变体或其功能结构域,如GFP、SuperfolderGFP、EGFP、BFP、EBFP、EBFP2、Azurite、mKalama1、CFP、ECFP、Cerulean、CyPet、mTurquoise2、YFP、Citrine、Venus、Ypet、BFPms1、roGFP和胆红素诱导荧光蛋白如UnaG、dsRed、eqFP611、Dronpa、TagRFPs、KFP、EosFP、Dendra、IrisFP等。在公开为WO2016148994A8的国际申请PCTUS2016021491中描述的任何融合伴体预期用于本发明,其通过引用并入本文并用于所有目的。在实施方案中,融合伴体是去甲基化结构域。在某些实施方案中,融合伴体是去甲基化增强子结构域。可以使用例如GoldenGateAssembly试剂盒制备任何所述PUF结构域参见Abil等,JournalofBiologicalEngineering8:7,2014,其可在Addgene获得Kit#1000000051。去甲基化和去甲基化增强子结构域本文提供了可用于使细胞中的去甲基化目标位点去甲基化的去甲基化蛋白缀合物和去甲基化增强子缀合物。去甲基化蛋白缀合物包括本文所述的PUF结构域、TET去甲基化结构域例如,TET1结构域和去甲基化增强子结构域例如,NEIL2结构域或GADD45A结构域。或者,本文提供的复合物包括去甲基化蛋白质缀合物,其包括第一PUF结构域和去甲基化结构域例如,TET1结构域,和去甲基化增强子缀合物,其包括第二PUF结构域和去甲基化增强子结构域例如,NEIL2结构域或GADD45A结构域。在某些实施方案中,去甲基化增强子结构域可操作地连接至PUF结构域的N-末端。在某些实施方案中,去甲基化增强子结构域可操作地连接至PUF结构域的C-末端。在某些实施方案中,去甲基化增强子结构域可操作地连接至第二PUF结构域的N-末端。在某些实施方案中,去甲基化增强子结构域可操作地连接至第二PUF结构域的C-末端。在某些实施方案中,去甲基化增强子结构域是生长阻滞和DNA损伤诱导αGADD45A结构域。在某些实施方案中,GADD45结构域具有SEQIDNO:85的氨基酸序列。在某些实施方案中,去甲基化增强子结构域是NEIL2结构域。在某些实施方案中,NEIL2结构域具有SEQIDNO:86的氨基酸序列。在某些实施方案中,去甲基化增强子结构域不是NEIL1结构域。在某些实施方案中,去甲基化增强子结构域不是NEIL3结构域。本文提供的“去甲基化增强子结构域”、“去甲基化增强子蛋白”或“去甲基化增强子酶”是指能够相对于在不存在激活物例如本文所述的去甲基化增强子结构域的情况下去甲基化酶或去甲基化结构域的活性或功能,积极影响例如增加去甲基化酶或去甲基化结构域的活性或功能的蛋白质、蛋白质结构域或蛋白质部分。因此,在某些实施方案中,去甲基化增强子结构域可以至少部分地部分或完全增加刺激,增加或启动活化,或激活去甲基化酶。与不存在去甲基化增强子结构域的情况下的对照相比,活性激活的增加量可以是10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更多。在某些实施方案中,活性是不存在去甲基化增强子结构域时的活性的1.5倍、2倍、3倍、4倍、5倍、10倍或更多。对于本文提供的缀合物,DNA去甲基化结构域可包括10-11易位1TET1结构域。在某些实施方案中,DNA去甲基化结构域包括10-11易位2TET2结构域。在某些实施方案中,DNA去甲基化结构域包括10-11易位3TET3结构域。在某些实施方案中,TET1结构域包括SEQIDNO:51的序列。在某些实施方案中,TET1结构域是SEQIDNO:51的序列。在某些实施方案中,TET蛋白是TET甲基胞嘧啶双加氧酶。TET甲基胞嘧啶双加氧酶催化导致用未甲基化的胞嘧啶代替5mC的初始和关键步骤。据发现,当TET1去甲基化酶催化结构域CD与PUF结构域的C-末端融合时,与TET1去甲基化酶催化结构域CD融合到PUF结构域的N-末端时相比,观察到的去甲基化酶活性出乎意料地高。因此,在某些实施方案中,去甲基化蛋白缀合物PUF结构域融合蛋白包括与PUF结构域的C-末端融合的TET1功能结构域。在某些实施方案中,PUF结构域是PUFa。在某些实施方案中,靶基因的转录增加超过10倍、15倍、20倍、25倍、30倍、50倍、75倍、100倍、125倍、135倍、150倍、200倍或更多。在某些实施方案中,靶基因是SOX。在某些实施方案中,靶基因包含两个或更多个靶多核苷酸序列。在某些实施方案中,所述相同或不同PUF结构域中的至少两个与去甲基化酶结构域或去甲基化酶增强子结构域融合。在实施方案中,去甲基化蛋白缀合物包括SEQIDNO:54或SEQIDNO:55的序列。在某些实施方案中,去甲基化蛋白质缀合物是SEQIDNO:54或SEQIDNO:55的序列。在实施方案中,去甲基化蛋白质缀合物包括SEQIDNO:104的序列。在某些实施方案中,去甲基化蛋白质缀合物是SEQIDNO:104的序列。在某些实施方案中,去甲基化蛋白质缀合物包括SEQIDNO:105的序列。在某些实施方案中,去甲基化蛋白质缀合物是SEQIDNO:105的序列。在实施方案中,去甲基化增强子缀合物包括SEQIDNO:106的序列。在某些实施方案中,去甲基化增强子缀合物是SEQIDNO:106的序列。在某些实施方案中,去甲基化增强子缀合物包括SEQIDNO:107的序列。在某些实施方案中,去甲基化增强子缀合物是SEQIDNO:107的序列。在实施方案中,去甲基化增强子缀合物包括SEQIDNO:108的序列。在某些实施方案中,去甲基化增强子缀合物是SEQIDNO:108的序列。在某些实施方案中,去甲基化增强子缀合物包括SEQIDNO:109的序列。在某些实施方案中,去甲基化增强子缀合物是SEQIDNO:109的序列。另外的复合物本发明的另一方面提供了包含本发明的任一种多核苷酸和修饰的Cas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白的复合物。在某些实施方案中,复合物包含核酸酶缺陷的wtCas9蛋白。在某些实施方案中,复合物可以进一步包含与一个或多个PBS结合的一个或多个PUF结构域或其融合体。在某些实施方案中,PUF结构域中的每一个与效应子结构域融合。在某些实施方案中,至少两个PUF结构域与不同的效应子结构域融合。在某些实施方案中,核酸酶缺陷的wtCas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白、PUF结构域和或效应子结构域还包含核定位信号NLS。在某些实施方案中,复合物通过多核苷酸的DNA靶向序列与靶多核苷酸序列结合。在某些实施方案中,效应子结构域是TET10-11易位蛋白质或保留去甲基化酶催化活性的其片段。例如,TET蛋白可以是TET甲基胞嘧啶双加氧酶。在某些实施方案中,PUF结构域融合蛋白包含与PUF结构域例如,PUFa的C-末端融合的TET1功能结构域。在某些实施方案中,PUF结构域融合蛋白包含与PUF结构域例如,PUFa的N-末端融合的Dnmt功能结构域。细胞在另一方面,提供了包含如本文包括其实施方案提供的去甲基化复合物的细胞。在某些实施方案中,细胞是哺乳动物细胞。在某些实施方案中,细胞是癌细胞。在某些实施方案中,细胞是癌细胞,和或靶基因是具有高甲基化启动子区的hMLH1。例如,靶多核苷酸序列可以在hMLH1的高甲基化启动子区域内,并且靶多核苷酸序列的甲基化与癌细胞中hMLH1的下调相关。在某些实施方案中,癌细胞来自胃癌、食道癌、头颈鳞状细胞癌HNSCC、非小细胞肺癌NSCLC和结肠直肠癌例如HNPCC。胃癌可包括小凹foveolar型肿瘤以及高发病率KashmirValley中的胃癌。本发明的另一方面提供了宿主细胞,其包括所述载体、多核苷酸和复合物中的任何一种。在某些实施方案中,宿主细胞还包含编码核酸酶缺陷的wtCas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白的第二载体。在某些实施方案中,第二载体进一步编码与核酸酶缺陷的wtCas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白融合的去甲基化效应子结构域。Cas9蛋白例如,wt、切口酶或dCas9蛋白的表达可以在组成型启动子或诱导型启动子的控制下。在某些实施方案中,宿主细胞可以进一步包括编码一个或多个PUF结构域的第三载体,该PUF结构域各自与去甲基化效应子结构域融合。一个或多个PUF结构域的表达可以独立地在组成型启动子或诱导型启动子的控制下。在某些实施方案中,第二载体可以进一步编码与核酸酶缺陷的wtCas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白或者甲基化或去甲基化效应子结构域融合的核定位信号NLS,和或第三载体可以进一步编码与PUF结构域或者甲基化或去甲基化效应子结构域融合的核定位信号NLS。在某些实施方案中,可以由不同载体编码的序列可以在同一载体上。例如,在某些实施方案中,第二载体可以与所述载体相同,和或第三载体可以与所述载体或第二载体相同。宿主细胞可以在活的动物中,或可以是培养细胞。方法本文提供的方法和复合物尤其提供了去甲基化活性的通用递送平台。使用本文提供的方法和复合物,可以依次或同时将包括去甲基化结构域和去甲基化增强子结构域例如,去甲基化酶和去甲基化增强子或其功能片段的去甲基化蛋白缀合物或者去甲基化蛋白缀合物和去甲基化增强子缀合物的组合递送至细胞。将本文提供的去甲基化蛋白缀合物或去甲基化蛋白缀合物和去甲基化增强子缀合物的组合递送至细胞允许微调靶向的基因座的甲基化状态。本发明还提供了多个去甲基化蛋白质缀合物的递送,其中缀合物可以相同或不同。当多个去甲基化蛋白质缀合物被递送至细胞时,缀合物可以形成多个缀合物的部分,其每个与PUF结构域连接,和或它们可以直接与核酸酶缺陷的RNA指导DNA核酸内切酶例如,dCas9融合。此外,且由于指导RNA的靶基因特异性,本发明允许同时向细胞中的不同靶位点递送增强的去甲基化活性。申请人首次证明,由于去甲基化结构域例如,TET1结构域与非常特异的增强子蛋白例如,GADD45A或NEIL2的配对,使用本文提供的复合物的去甲基化与例如在没有增强子结构域的情况下的去甲基化相比或与将去甲基化活性直接连接到核酸酶缺陷的RNA指导DNA内切核酸酶例如,dCas9相比更有效。对于本文包括其实施方案提供的去甲基化方法,可以使用上述复合物的任何元件。因此,在某些实施方案中,该方法包括递送编码如本文包括其实施方案提供的核酸酶缺陷的RNA指导DNA核酸内切酶例如,dCas9的第一多核苷酸。因此,该方法可以包括递送第二多核苷酸,其是本文包括其实施方案描述的多核苷酸并且其编码本文提供的DNA靶向序列、结合序列和一个或多个PUF结合位点PBS序列。在另一个方面,提供了在哺乳动物细胞中使靶核酸序列去甲基化的方法。该方法包括:a提供含有需要去甲基化的靶核酸的哺乳动物细胞;b向哺乳动物细胞递送编码核酸酶缺陷的RNA指导DNA核酸内切酶的第一多核苷酸;c向哺乳动物细胞递送第二多核苷酸,其包括:i与靶多核苷酸序列互补的DNA靶向序列;ii核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和iii一个或多个PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与第二多核苷酸结合;d向哺乳动物细胞递送编码去甲基化蛋白质缀合物的第三多核苷酸,该去甲基化蛋白质缀合物包含:i具有C-末端的PUF结构域;ii具有N-末端和C-末端的去甲基化增强子结构域,其中去甲基化增强子结构域的N-末端可操作地连接到PUF结构域的C-末端;和iii可操作地连接到去甲基化增强子结构域的C-末端的TET去甲基化结构域,由此递送的去甲基化蛋白质缀合物使细胞中的靶核酸序列去甲基化。在一个方面,提供了去甲基化复合物。该去甲基化复合物包括:a核糖核蛋白复合物,包括:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,其包括:1与靶多核苷酸序列互补的DNA靶向序列;2核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;3第一PUF结合位点PBS序列;和4第二PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与多核苷酸结合;b去甲基化蛋白质缀合物,包括:i具有C-末端的第一PUF结构域,和ii与第一PUF结构域的C-末端可操作地连接的TET去甲基化结构域,其中去甲基化蛋白质缀合物通过第一PUF结构域结合第一PBS序列而与核糖核蛋白复合物结合;和c去甲基化增强子缀合物,包括:i第二PUF结构域;和ii与第二PUF结构域可操作地连接的去甲基化增强子结构域,其中去甲基化增强子缀合物通过第二PUF结构域与第二PBS序列结合而与核糖核蛋白复合物结合以形成去甲基化复合物。在另一个方面,提供了在哺乳动物细胞中使靶核酸序列去甲基化的方法。该方法包括:a提供含有需要去甲基化的靶核酸的哺乳动物细胞;b向哺乳动物细胞递送编码核酸酶缺陷的RNA指导DNA内切核酸酶的第一多核苷酸;c向哺乳动物细胞递送第二多核苷酸,其包括:i与靶多核苷酸序列互补的DNA靶向序列;ii核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;iii第一PUF结合位点PBS序列,和iv第二PUF结合位点PBS序列,其中核酸酶缺陷的RNA指导DNA核酸内切酶通过结合序列与第二多核苷酸结合;d向哺乳动物细胞递送编码去甲基化蛋白缀合物的第三多核苷酸,该去甲基化蛋白缀合物包括:i第一PUF结构域;和ii去甲基化结构域,该去甲基化结构域可操作地连接到第一PUF结构域的C-末端,和e向哺乳动物细胞递送编码去甲基化增强子缀合物的第四多核苷酸,该去甲基化增强子缀合物包括:i第二PUF结构域;和ii与第二PUF结构域可操作地连接的去甲基化增强子结构域,由此递送的去甲基化蛋白质缀合物使细胞中的靶核酸序列去甲基化。在某些实施方案中,去甲基化蛋白缀合物通过PUF结构域与一个或多个PBS序列结合而与核糖核蛋白复合物结合以形成去甲基化复合物。在某些实施方案中,第一多核苷酸包含在第一载体内。在某些实施方案中,第二多核苷酸包含在第二载体内。在某些实施方案中,第三多核苷酸包含在第三载体内。在某些实施方案中,第一、第二或第三载体是相同的。在某些实施方案中,递送通过转染进行。在某些实施方案中,去甲基化蛋白缀合物通过第一PUF结构域结合第一PBS序列而与核糖核蛋白复合物结合。在某些实施方案中,去甲基化增强子缀合物通过第二PUF结构域结合第二PBS序列而与核糖核蛋白复合物结合。在某些实施方案中,去甲基化增强子结构域可操作地连接至第二PUF结构域的N-末端。在某些实施方案中,去甲基化增强子结构域可操作地连接至第二PUF结构域的C-末端。在某些实施方案中,第一多核苷酸包含在第一载体内。在某些实施方案中,第二多核苷酸包含在第二载体内。在某些实施方案中,第三多核苷酸包含在第三载体内。在某些实施方案中,第四多核苷酸包含在第四载体内。在某些实施方案中,第一、第二、第三或第四载体是相同的。在某些实施方案中,递送通过转染进行。在某些实施方案中,本发明的方法利用多个载体或载体的文库,每个载体编码本发明的多核苷酸,其中两个载体在所编码的它们各自的DNA靶向序列的多核苷酸、Cas9-结合序列和或PBS的拷贝数、身份序列、结合特异性等或相对顺序上不同。在相关实施方案中,代替使用载体,使用非载体编码序列。在某些实施方案中,该方法还包括向细胞中引入多个任何一种所述载体,其中两个载体在所编码的它们各自的DNA靶向序列的多核苷酸、Cas9结合序列和或PBS的拷贝数、身份或相对顺序上不同。在相关实施例中,代替使用载体,使用非载体编码序列。治疗方法细胞中增强的靶核酸去甲基化的方法尤其可用于治疗与异常DNA甲基化相关或由其引起的疾病例如癌症。已经提出了胞苷脱氨酶的表观遗传DNA甲基化和遗传突变作用在癌症中的作用,并且在去甲基化其是广泛的中可能的作用。本发明通过改变癌细胞内的去甲基化或去甲基化状态在改善治疗癌症疾病过程中具有实际应用。使用本文提供的方法和组合物,可以靶向于甲基化的基因以用于体内去甲基化,这可以导致它们的表达甲基化在大多数时候是抑制性修饰。大多数如果不是全部癌症经历表观遗传变化,包括显著地肿瘤抑制基因的甲基化和沉默。肿瘤抑制基因的去甲基化可以改善癌症表型。因此,将体内去甲基化靶向肿瘤抑制基因的方法是癌症治疗的非常有前景的途径。将胞苷脱氨酶活性靶向癌症中感兴趣的基因可包括,例如,胞苷脱氨酶与肿瘤阻遏DNA结合结构域如p53蛋白的锌指DNA核心结合区的融合。据信,在许多癌症中,p53的DNA结合结构域的突变可以造成转化。此外,许多肿瘤抑制基因的启动子区域包括p53靶标在癌细胞中被甲基化。通过利用体外和离体分析,可以评估本发明的分子和药物组合物的抗癌抗肿瘤发生作用。在一种合适的分析中,将表达本发明分子的核酸载体转染到癌细胞中。建立适当的对照,其包括仅用载体骨架转染的癌细胞系,或载体加上本发明的分子其中使胞苷脱氨酶结构域失去功能,下面将更详细地描述。在用本发明的分子转染癌细胞系中但不在对照细胞中诱导的细胞凋亡将指示本发明分子的抗癌作用。在另一个方面,提供了治疗有此需要的受试者的癌症的方法。该方法包括向受试者施用治疗有效量的本文包括其实施方案提供的去甲基化复合物或甲基化复合物,从而治疗受试者中的癌症。在优选的实施方案中,该方法包括向受试者施用治疗有效量的本文提供的去甲基化复合物。在另一方面,提供了药物组合物。药物组合物包括治疗有效量的本文包括其实施方案提供的去甲基化复合物和药学上可接受的赋形剂。本文提供的方法和组合物的其他应用包括在发育过程中调节基因表达。例如,位点特异性的DNA结合结构域的存在允许在发育中或细胞周期期间的特定时间激活的特定基因子集的靶向去甲基化。例如,例如,Oct4或SOX-2蛋白质的DNA结合结构域当与PUF结构域融合时可以提供去甲基化活性,其是针对涉及促进多能性或干细胞样表型的细胞命运决策的基因。或者,去甲基化结构域可以通过接头与PUF结合结构域连接。可任选地使用的DNA结合结构域包括来自T-box转录因子或类固醇激素受体DNA结合结构域如RAR和RXRDNA结合结构域的那些。然而,本发明的去甲基化蛋白质缀合物可足以使多能基因的启动子去甲基化并在分化期间改变细胞的甲基化状态。进一步的方法本发明的另一方面提供了根据本发明的任何方法调节癌细胞中靶基因的转录和或甲基化状态的方法,其中癌细胞与异常DNA甲基化相关或以其为特征。本发明的相关方面提供了根据本发明的任何方法调节患者癌细胞中靶基因的转录和或甲基化状态的方法,其中所述癌细胞与异常的DNA甲基化相关或以其为特征。本发明的另一相关方面提供了治疗需要治疗的患者的与靶基因的异常DNA甲基化如CpG甲基化相关的疾病或病症的方法,该方法包括允许在靶基因附近或靶基因处形成本发明的复合物以调节患者中靶基因的转录和或甲基化状态。本发明的另一相关方面提供了治疗需要治疗的患者的与靶基因的异常DNA甲基化如CpG甲基化相关的疾病或病症的方法,该方法包括根据任何所述方法调节患者中的靶基因转录和或甲基化状态。本发明的另一相关方面提供了治疗需要治疗的患者的与靶基因的异常DNA甲基化如CpG甲基化相关的疾病或病症的方法,该方法包括允许在靶基因附近或靶基因处形成本发明的复合物以调节患者中靶基因的转录和或甲基化状态。在相关的方面,本发明提供了治疗需要治疗的患者的癌症的方法,其中所述癌症与hMLH1的异常DNA甲基化相关或以其为特征,该方法包括根据本发明的任何一种方法调节患者中的hMLH1的转录和或甲基化状态。例如,在某些实施方案中,PUF结构域融合蛋白可包含与PUF结构域如PUFa的C-末端融合的TET1功能结构域。在某些实施方案中,hMLH1的高甲基化启动子区的甲基化水平降低。在某些实施方案中,hMLH1的转录翻译增加。在某些实施方案中,靶基因是hMLH1。在某些实施方案中,疾病是癌症。在某些实施方案中,疾病是印迹障碍imprintingdisorder。在某些实施方案中,疾病是神经疾病。在某些实施方案中,癌症分别与肿瘤抑制基因或致癌基因的高甲基化或低甲基化相关或以其为特征。在某些实施方案中,癌症是胃癌包括小凹型肿瘤、高发病率KashmirValley中的胃癌、食道癌、头颈鳞状细胞癌HNSCC、非小细胞肺癌NSCLC和结肠直肠癌如HNPCC。本发明的再另一方面提供了在靶多核苷酸序列处组装本发明的复合物的方法,该方法包括使以下与靶多核苷酸序列接触或携带到其附近:1任何一种所述多核苷酸、或任何一种所述载体或多个载体;2核酸酶缺陷的wtCas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白,或任何一个编码核酸酶缺陷的wtCas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白的所述第二载体;和3一个或多个PUF结构域每个与效应子结构域结合,或任何一个编码PUF结构域融合体的第三载体。在某些实施方案中,融合是与DNA甲基转移酶或去甲基酶。在某些实施方案中,复合物在细胞内组装,靶多核苷酸序列是细胞的基因组DNA的部分,并且其中所述载体、第二载体和第三载体被引入细胞中。本发明的相关方面提供了调节细胞中多个靶基因的转录的方法,该方法包括:向细胞中引入所述多个载体、dCas9蛋白的编码序列和用于一个或多个PUF结构域融合体的编码序列,其中每个靶基因包含靶多核苷酸序列,其允许1在靶多核苷酸序列处由多个载体之一编码的多核苷酸、dCas9蛋白和PUF结构域融合体的三联复合物的组装;和2包含靶多核苷酸序列的靶基因的转录调节。在相关方面,本发明还提供了一种在细胞中的多个靶基因处进行表观遗传调节例如,调节不直接与转录活性相关的染色质的表观遗传状态的方法,该方法包括:向细胞中引入所述多个载体、核酸酶缺陷的wtCas9蛋白的编码序列和一个或多个PUF结构域融合体的编码序列,其中每个靶基因包含靶多核苷酸序列,其允许1由所述多个载体之一编码的多核苷酸、wtCas9蛋白或Cas9切口酶和PUF结构域融合体的三联复合物在靶多核苷酸序列处的组装;2包含靶多核苷酸序列的靶基因的表观遗传调节。该方法可用于例如同时改变表观遗传状态例如,打开染色质以获得与封闭的染色质位点结合的核酸酶缺陷的wtCas9蛋白例如,dCas9的接近稳定性例如,以增加那些位点处的切割和基因组编辑。在某些实施方案中,增强刺激至少一种靶基因的转录,同时抑制至少另一种靶基因的转录。在本发明的一个方面,提供了调节细胞中具有靶多核苷酸序列的靶基因的转录和或甲基化状态的方法,该方法包括:a向细胞中引入PUF结构域融合蛋白的编码序列,其中所述PUF结构域融合蛋白包含PUF结构域和DNA甲基转移酶活性结构域或DNA脱甲基酶活性结构域;b向细胞中引入dCas9蛋白的编码序列;和c向细胞中引入多核苷酸或所述多核苷酸的编码序列,其中所述多核苷酸包含:i与靶多核苷酸序列互补的DNA靶向序列;ii一个或多个拷贝的PUF结合位点PBS序列,其中所述一个或多个拷贝的PBS中的每一个与相同或不同的PUF结构域融合蛋白结合;和iii能够结合dCas9蛋白的Cas9结合序列;其中所述PUF结构域融合蛋白、所述dCas9蛋白和所述多核苷酸在所述细胞的靶基因内的靶多核苷酸序列处形成复合物,从而调节靶基因的转录和或甲基化状态。应当注意,可以将PUF结构域融合蛋白的编码序列、核酸酶缺陷的RNA指导DNA核酸内切酶dCas9蛋白的编码序列和所述多核苷酸或编码多核苷酸的载体一起引入细胞中例如,通过在同一载体上包括所有编码序列,通过共转染编码不同编码序列的不同载体等,或者根据需要以任何顺序或序列单独地引入。在某些优选的实施方案中,PUF结构域融合蛋白的编码序列、核酸酶缺陷的RNA指导DNA核酸内切酶dCas9蛋白的编码序列和所述多核苷酸或编码多核苷酸的载体共同引入细胞中。另外,如果本发明的a、b和c步骤单独地进行,则它们不必要求必须以任何特定顺序进行。靶多核苷酸序列可以是任何DNA序列。在某些实施方案中,靶多核苷酸序列包含一个或多个转录调控元件或与其相邻。在某些实施方案中,转录调控元件包含以下的一种或多种:核心启动子、近端启动子元件、增强子、沉默子、隔离子和基因座控制区。试剂盒在另一方面,提供了一种试剂盒。该试剂盒包括:i本文包括其实施方案提供的核糖核蛋白复合物或编码其的核酸;和ii本文包括其实施方案提供的去甲基化蛋白质缀合物或编码其的核酸。在另一方面,提供了试剂盒。该试剂盒包括:i本文包括其实施方案提供的核糖核蛋白复合物或编码其的核酸;ii本文包括其实施方案提供的去甲基化蛋白质缀合物或编码其的核酸;和iii本文包括其实施方案提供的去甲基化增强子缀合物或编码其的核酸。在实施方案中,所述试剂盒可包括:a本发明的多核苷酸,或包含编码其的核苷酸序列的核酸例如,载体;任选地,b所述核酸酶缺陷的wtCas9蛋白例如,核酸酶缺陷的wtCas9蛋白或dCas9蛋白,或编码其包括编码其的可表达的mRNA的载体;和任选地,c一种或多种所述去甲基化或甲基化蛋白质缀合物PUF结构域融合体或编码其包括编码其的可表达的mRNA的载体,该去甲基化或甲基化蛋白质缀合物各自包括与去甲基化或甲基化结构域效应子结构域融合的PUF结构域,该去甲基化或甲基化结构域在不同的去甲基化或甲基化蛋白质缀合物PUF结构域融合体中可以相同或不同,。在某些实施方案中,a-c中的一个或多个可以由相同的载体编码。在某些实施方案中,试剂盒还包含一种或多种缓冲剂或有助于将a-c中的任一种引入宿主细胞的试剂,例如用于转化、转染或感染的试剂。例如,所述试剂盒可以进一步包括一种或多种另外的试剂,其中这些另外的试剂可以选自:缓冲剂、洗涤缓冲液、对照试剂、对照表达载体或RNA多核苷酸、用于从DNA体外产生核酸酶缺陷的wtCas9蛋白或dCas9或PUF结构域融合体的试剂;等等。所述试剂盒的组分可以在单独的容器中;或者可以组合在单一容器中。除了上述组分之外,所述试剂盒还可以包括使用试剂盒的组分来实施所述方法的说明书。用于实施所述方法的说明书通常记录在合适的记录介质上。例如,说明书可以印刷在基材上,如纸或塑料等。因此,说明书可以作为包装插页存在于试剂盒中,在试剂盒的容器或其组件的标签中即,与包装或分包装相关,等等。在其他实施方案中,说明书作为存在于合适的计算机可读存储介质例如CD-ROM、软盘、闪存盘等上的电子存储数据文件存在。在再其他实施方案中,实际说明书不存在于试剂盒中,而是提供用于从远程源获得说明书的装置,例如通过互联网。该实施方案的实例是包括网址的试剂盒,其中可以查看说明书和或可以从其下载说明书。与说明书一样,这种用于获得说明书的装置记录在合适的基材上。利用上面一般性描述的本发明,下面将进一步详细说明本发明的各种特征。应当理解,本发明的特征,即使在单独的实施方案或甚至在本发明的不同方面下的单独实施方案的上下文中描述,也可以在单个实施方案中组合提供。相反,在单个实施方案的上下文中描述的本发明的各种特征也可以单独提供或以任何合适的子组合提供。本发明具体包括与本发明有关的实施方案的所有组合,并且其在本文中公开,就好像各个和每个组合被单独和明确地公开一样。此外,本发明还具体包括了各种实施方案及其元件的所有子组合,并且其在本文中公开,就好像在此单独和明确地公开了每个这样的子组合。定义除非另外定义,否则本文使用的技术和科学术语具有与本领域普通技术人员通常理解的含义相同的含义。参见,例如,Singleton等,DICTIONARYOFMICROBIOLOGYANDMOLECULARBIOLOGY2nded.,J.Wiley&SonsNewYork,NY1994;Sambrook等,MOLECULARCLONING,ALABORATORYMANUAL,ColdSpringsHarborPressColdSpringsHarbor,NY1989。与本文描述的那些类似或等同的任何方法、装置和材料均可用于本发明的实践中。提供以下定义是为了便于理解本文中频繁使用的某些术语,并不意味着限制本公开的范围。“核酸”是指单链,双链或多链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物,或其互补物。术语“多核苷酸”是指核苷酸的线性序列。术语“核苷酸”通常是指多核苷酸的单个单元,即单体。核苷酸可以是核糖核苷酸、脱氧核糖核苷酸或其修饰形式。本文考虑的多核苷酸的实例包括单链和双链DNA、单链和双链RNA包括siRNA和mRNA以及具有单链和双链DNA和RNA的混合物的杂合分子。核酸可以是线性或分支的。例如,核酸可以是核苷酸的线性链或核酸可以是分支的,例如,以使得核酸包含一个或多个核苷酸的臂或分支。任选地,支化的核酸重复分支以形成更高级的结构,如树枝状大分子等。核酸,包括具有硫代磷酸酯骨架的核酸,可包括一个或多个反应性部分。如本文所用,术语反应性部分包括能够通过共价、非共价或其他相互作用与另一分子例如核酸或多肽反应的任何基团。举例来说,核酸可包括氨基酸反应性部分,其通过共价、非共价或其他相互作用与蛋白质或多肽上的氨基酸反应。该术语还包括含有已知核苷酸类似物或修饰的骨架残基或键的核酸其是合成的、天然存在的和非天然存在的,其具有与参考核酸相似的结合特性,并且其以类似于参考核苷酸的方式代谢。此类类似物的实例包括但不限于磷酸二酯衍生物,包括例如氨基磷酸酯、二氨基磷酸酯、硫代磷酸酯也称为硫逐磷酸酯、二硫代磷酸酯、膦酰基羧酸、膦酰羧酸酯、膦酰基乙酸、膦酰基甲酸、膦酸甲酯、硼膦酸酯或O-甲基亚磷酰胺键参见Eckstein,OligonucleotidesandAnalogues:APracticalApproach,OxfordUniversityPress;和肽核酸骨架和连接。其他类似核酸包括具有正主链的核酸;非离子主链、修饰的糖和非核糖主链例如磷酰二胺吗啉代寡聚体或锁核酸LNA的那些,包括美国专利号5,235,033和5,034,506以及ASCSymposiumSeries580,CarbohydrateModificationsinAntisenseResearch,Sanghui&Cook编辑,第6章和第7章中描述的那些。含有一个或多个碳环糖的核酸也包括在核酸的定义内。可以出于多种原因进行核糖-磷酸酯主链的修饰,例如,增加这些分子在生理环境中的稳定性和半衰期,或作为生物芯片上的探针。可以制备天然存在的核酸和类似物的混合物;或者,可以制备不同核酸类似物的混合物,以及天然存在的核酸和类似物的混合物。在某些实施方案中,DNA中的核苷酸间连接是磷酸二酯、磷酸二酯衍生物或两者的组合。如本文使用的,所提供的值的范围包括指定值。如本领域普通技术人员所认识到的,这样的指定值将合理地包括使用本领域通常可接受的测量的标准偏差。在某些实施方案中,标准偏差包括延伸至指定值的+-10%的范围。术语“多肽”、“肽”和“蛋白质”在本文中可互换使用以指氨基酸残基的聚合物,其中该聚合物可以与不由氨基酸组成的部分缀合。该术语适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学模拟物的氨基酸聚合物,以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。该术语适用于大环肽、已经用非肽官能性修饰的肽、肽模拟物、聚酰胺和大环内酰胺。“融合蛋白”是指编码两个或更多个单独的蛋白质序列其作为单一部分重组表达的嵌合蛋白质。术语“肽基”和“肽基部分”是指单价肽。术语“氨基酸”是指天然存在的和合成的氨基酸,以及以与天然存在的氨基酸类似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的那些氨基酸,以及后来被修饰的那些氨基酸,例如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物是指具有与天然存在的氨基酸相同的基本化学结构即与氢、羧基、氨基和R基团结合的α碳的化合物,例如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。此类类似物具有修饰的R基团例如,正亮氨酸或修饰的肽主链,但保留与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构,但是以与天然存在的氨基酸类似的方式起作用的化学化合物。术语“非天然存在的氨基酸”和“非天然氨基酸”是指在自然界中未发现的氨基酸类似物、合成氨基酸和氨基酸模拟物。氨基酸在本文中可以通过由IUPAC-IUBBiochemicalNomenclatureCommission推荐的它们通常已知的三字母符号或单字母符号表示。同样,核苷酸可以通过它们通常接受的单字母代码来指代。氨基酸或核苷酸碱基“位置”通过基于其相对于N-末端或5'-末端的位置在参考序列中顺序地标识每个氨基酸或核苷酸碱基的数字表示。由于在确定最佳比对时必须考虑的缺失、插入、截短、融合等,通常通过简单地从N-末端计数而确定的测试序列中的氨基酸残基编号不一定与参考序列中相应位置的编号相同。例如,在其中变体相对于比对的参考序列具有缺失的情况下,变体中将不存在参考序列中对应于缺失位点处的位置的氨基酸。当在比对的参考序列中存在插入时,该插入将不对应于参考序列中编号的氨基酸位置。在截短或融合的情况下,参考序列或比对序列中可存在不对应于相应序列中的任何氨基酸的氨基酸区段。当在给定氨基酸或多核苷酸序列的编号的情况中使用时,术语“参照…编号”或“对应于”是指当给定氨基酸或多核苷酸序列与参考序列进行比较时,指定参考序列的残基的编号。“保守修饰的变体”适用于氨基酸和核酸序列。关于特定的核酸序列,保守修饰的变体是指编码相同或基本上相同的氨基酸序列的那些核酸,或者在其中核酸不编码氨基酸序列的情况中,是指基本上相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定的蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在其中丙氨酸通过密码子指定的每个位置处,密码子可以改变为所述的任何相应密码子而不改变编码的多肽。这种核酸变异是“沉默变异”,其是保守修饰变体的一个种类。编码多肽的本文中每个核酸序列也描述了核酸的每种可能的沉默变异。技术人员将认识到,核酸中的每个密码子除了AUG,其通常是甲硫氨酸的唯一密码子,和TGG,其通常是色氨酸的唯一密码子可以被修饰以产生功能相同的分子。因此,编码多肽的核酸的每个沉默变异隐含在关于表达产物的每个所述序列中,但不是关于实际探针序列。关于氨基酸序列,技术人员将认识到核酸、肽、多肽或蛋白质序列的单个置换、缺失或添加其改变、添加或删除编码序列中的单个氨基酸或小百分比的氨基酸是“保守修饰的变体”,其中该改变导致氨基酸用化学上相似的氨基酸取代。提供功能上相似的氨基酸的保守置换表是本领域熟知的。此类保守修饰的变体是对本发明的多态性变体、种间同源物和等位基因的补充,并且不排除本发明的多态性变体、种间同源物和等位基因。以下八组各自含有作为彼此的保守置换的氨基酸:1丙氨酸A,甘氨酸G;2天冬氨酸D,谷氨酸E;3天冬酰胺N,谷氨酰胺Q;4精氨酸R,赖氨酸K;5异亮氨酸I,亮氨酸L,甲硫氨酸M,缬氨酸V;6苯丙氨酸F,酪氨酸Y,色氨酸W;7丝氨酸S,苏氨酸T;和8半胱氨酸C,蛋氨酸M。“序列同一性百分比”通过在比较窗口上比较两个最佳比对的序列来确定,其中比较窗口中的多核苷酸或多肽序列的部分可以包含与用于两个序列的最佳比对的参考序列其不包括添加或缺失相比的添加或缺失即,空位。该百分比通过确定在两个序列中存在的相同核酸碱基或氨基酸残基的位置数以产生匹配位置的数目,将匹配位置的数量除以比较窗口中的位置总数,并将结果乘以100以得到序列同一性的百分比来计算。在两个或更多个核酸或多肽序列的情况中,术语“同一”或百分“同一性”是指当使用以下序列比较算法之一或通过手动比对和目视检查测量的在比较窗口或者指定区域上比较和以最大对应性比对时,两个或更多个相同或具有指定百分比的相同氨基酸残基或核苷酸的序列或子序列即,例如在本发明的整个多肽序列或本发明多肽的单个结构域的指定区域上60%的同一性,任选地65%、70%、75%、80%、85%、90%、95%、98%或99%。这些序列然后被称为“基本相同”。该定义还涉及测试序列的互补序列。任选地,同一性存在于长度为至少50个核苷酸的区域上,或更优选地长度为100至500或1000个或更多个核苷酸的区域上。对于序列比较,通常一个序列充当测试序列与其比较的参考序列。当使用序列比较算法时,将测试和参考序列输入计算机中,指定子序列坐标如果需要,并指定序列算法程序参数。可以使用默认程序参数,或者可以指定替代参数。然后,序列比较算法基于程序参数计算测试序列相对于参考序列的百分序列同一性。如本文所用,“比较窗口”包括对从由例如全长序列或20至600、50至200或100至150个氨基酸或核苷酸组成的组中选择的多个连续位置中任何一个的片段的引用,其中可以在两个序列最佳对准后将序列与相同数目的连续位置的参考序列进行比较。用于比较的序列比对方法是本领域熟知的。用于比较的序列最佳比对可以例如通过Smith和Waterman1970Adv.Appl.Math.2:482c的局部同源性算法,通过Needleman和Wunsch1970J.Mol.Biol.48:443的同源性比对算法,通过Pearson和Lipman1988Proc.Nat’l.Acad.Sci.USA85:2444的相似性检索方法1988,通过这些算法的计算机化实现WisconsinGeneticsSoftwarePackage,GeneticsComputerGroup,575ScienceDr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA,或通过手动比对和目视检查参见例如,Ausubel等,CurrentProtocolsinMolecularBiology1995增刊进行。适用于确定百分序列同一性和序列相似性的算法的实例是BLAST和BLAST2.0算法,其分别在Altschul等1977Nuc.AcidsRes.25:3389-3402和Altschul等1990J.Mol.Biol.215:403-410中描述。用于进行BLAST分析的软件可通过NationalCenterforBiotechnologyInformationhttp:www.ncbi.nlm.nih.gov公开获得。该算法涉及首先通过识别查询序列中长度W的短字来鉴定高评分序列对HSP,其当与数据库序列中相同长度的字比对时匹配或满足一些正值阈值分数T。T被称为邻域字得分阈值Altschul等,同上。这些初始邻域字命中作为用于启动检索以找到包含它们的更长HSP的种子。只要可以增加累积比对分数,字命中就沿着每个序列在两个方向上延伸。对于核苷酸序列,使用参数M一对匹配残基的奖励得分;总是0和N错配残基的罚分;总是NLSPUFa_VP64Key:NLSPUFaVP64SEQIDNO:32MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID在上述序列中,NLS序列是残基6-12,PUFaSEQIDNO:2是残基15-363,和VP64是残基371-421。NLSPUFb_VP64Key:NLSPUFbVP64SEQIDNO:33MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID在上述序列中,NLS序列是残基6-12,PUFbSEQIDNO:3是残基15-363,和VP64是残基371-421。NLSPUFw_VP64Key:NLSPUFwVP64SEQIDNO:34MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGCRVIQKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFASNVVEKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID在上述序列中,NLS序列是残基6-12,PUFwSEQIDNO:5是残基15-363,和VP64是残基371-421。NLSPUFc_VP64Key:NLSPUFcVP64SEQIDNO:35MGILPPKKKRKVSRGRSRLLEDFRNNRYPNLQLREIAGHIMEFSQDQHGSRFIQLKLERATPAERQLVFNEILQAAYQLMVDVFGNYVIQKFFEFGSLEQKLALAERIRGHVLSLALQMYGSRVIEKALEFIPSDQQNEMVRELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFALSTHPYGCRVIQRILEHCLPDQTLPILEELHQHTEQLVQDQYGSYVIEHVLEHGRPEDKSKIVAEIRGNVLVLSQHKFANNVVQKCVTHASRTERAVLIDEVCTMNDGPHSALYTMMKDQYANYVVQKMIDVAEPGQRKIVMHKIRPHIATLRKYTYGKHILAKLEKYYMKNGVDLGGPAGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLYID在上述序列中,NLS序列是残基6-12,PUFcSEQIDNO:4是残基15-363,和VP64是残基371-421。实施例4:使用所述3-组分CRISPRCas复合物系统Casilio和dCas9-系留酶的靶向DNA去甲基化和甲基化为简单起见,所述3-组分CRISPRCas复合物系统在本文中也可称为“Casilio”。使用具有Tet1效应子的Casilio-ME,该实施例证明了hMLH1转录的稳定激活,其是由于启动子区域中的高甲基化而在HEK293T细胞和其他癌细胞中表观遗传沉默的基因。hMLH1转录的重激活导致MLH1蛋白的表达的恢复。实施例显示Casilio-ME介导的TET1活性向hMLH1启动子区域的递送在靶向CpG岛内诱导稳定的胞嘧啶去甲基化,从而提供了Casilio-ME是编辑表观基因组的甲基胞嘧啶标记的稳定平台的主要证据。另一方面,还显示将具有Dnmt效应子的Casilio-ME靶向于SOX2启动子导致基因抑制,证明定向Dnmt介导的DNA甲基化以在所需基因座处改变基因表达或表观遗传状态的潜力。结果Casilio介导的去甲基化酶递送至特定基因组基因座对基因表达的影响。为了开发简单而有效的工具使得能够将去甲基化酶递送到特定的基因组基因座以允许其表观遗传甲基化状态的靶向改变,Casilio-ME系统进行工程化。这是建立在三组分Casilio平台上的参见PCTUS2016021491;62132,644;和62221,249;也参见Cheng,AW等,Casilio:aversatileCRISPR-Cas9-Pumiliohybridforgeneregulationandgenomiclabeling.CellRes,2016.262:p.254-7,其通过引用并入,其使用核酸酶缺陷的dCas9、含用于PumilioPUFRNA结合结构域的修饰的sgRNAsgRNA-PBS和由与效应子蛋白融合的PumilioRNA结合结构域构成的效应子模块。当与sgRNA复合时,dCas9结合DNA而不产生双链断裂,从而用作RNA可编程DNA结合蛋白,其特异性由系统的sgRNA组分中的序列决定。可以对PUF结构域进行编程以结合以多拷贝附加到sgRNA的3'末端的任何8-聚RNA序列PBS而不干扰sgRNA介导的dCas9的DNA结合Cheng,AW等,Casilio:aversatileCRISPR-Cas9-Pumiliohybridforgeneregulationandgenomiclabeling.CellRes,2016.262:p.254-7。在sgRNA上存在多个拷贝的PBS允许将多拷贝的PUF-效应子模块系留到基因组位点,且因此加强了在应用中对任何效应子模块的响应的强烈放大的实现。为了实现Casilio介导的胞嘧啶去甲基化和随后特定基因组基因座处的基因激活,将TET1-效应子模块构建为PUFa与TET1催化结构域的N-末端或C-末端融合体,其包括残基1418至2136TET1TET1CD。hMLH1的启动子区域已知其高甲基化诱导hMLH1表达的沉默Deng,G.等,MethylationofCpGinasmallregionofthehMLH1promoterinvariablycorrelateswiththeabsenceofgeneexpression.CancerRes,1999.599:p.2029-33选择作为本研究的目标。MLH1蛋白是细胞的甲基定向错配修复系统的组分。事实上,hMLH1在HEK293T细胞中与其他癌细胞一样被沉默,因此代表了一种良好的细胞模型来测试TET1-效应子诱导去甲基化介导的基因激活的能力。在启动子区域周围设计了9个sgRNA,其甲基化与癌细胞中hMLH1的下调相关图3ADeng,G.等,MethylationofCpGinasmallregionofthehMLH1promoterinvariablycorrelateswiththeabsenceofgeneexpression.CancerRes,1999.599:p.2029-33。为了测试该系统,用Casilio-ME组分包括Ct或Nt-融合TET1-效应子和3或2个sgRNA的组合转染HEK293T细胞。通过使用在转染后60小时从细胞提取的RNA和作为内源对照用于qRT-PCR测量的标准化的GAPDH,在TaqMan分析中测定hMLH1mRNA的相对水平。这表明PUFa-TET1CDC-末端融合效应子恢复了稳定的hMLH1表达,其在sgRNA3+7存在下达到超过背景的135倍图3B。然而,TET1CD-PUFaN-末端效应子融合在相同sgRNA组合combo的存在下显示出弱得多的激活最多20倍,可能是由于空间位阻,因为TET1CD天然位于TET1全长蛋白质的C-末端。因此表明Casilio介导的去甲基化酶向特定基因组基因座的递送使得基因表达的稳定改变成为可能。为了将获得的TET1介导的hMLH1表达激活与通过将转录因子和转录机构募集到hMLH1启动子而诱导的激活进行比较,将TET1-效应子替换为p65HSF1-效应子。使用相同的sgRNA组合,这表明达到超过背景200倍的较高激活图3B。因此,这表明Casilio-ME介导的hMLH1表达的激活可以实现通过强转录激活物模块如p65HSF1获得的激活的约70%,从而表明Casilio-ME是一种能够有效靶向和递送去甲基化酶以改变基因组的甲基化状态和相关的沉默活性的有效工具。将dCas9-系留的去甲基化酶递送至特定基因座对基因表达的影响。与dCas9蛋白的直接融合已被广泛用于将效应子靶向于特定基因组基因座,并且最近还用于递送TET1CD以诱导去甲基化和相关基因激活Morita,S.等,TargetedDNAdemethylationinvivousingdCas9-peptiderepeatandscFv-TET1catalyticdomainfusions.NatBiotechnol,2016;Xu,X.等,ACRISPR-basedapproachfortargetedDNAdemethylation.CellDiscov,2016.2:p.16009。为了评估与Casilio-ME相比,dCas9-TET1CD直接融合激活HEK293T细胞中hMLH1表达的效率,构建了dCas9与TET1CD的N-末端和C-末端融合体。使用与Casilio-ME实验中相同的sgRNA组合,dCas9-TET1CDC-末端融合显示相对弱的hMLH1激活,如通过mRNA水平的相对变化所指示的图3C。dCas9-TET1CD诱导的激活在平行实验中使用具有相同sgRNA组合的Casilio-ME代表所获得的激活的最多约14%19-倍比135-倍的mRNA水平变化。相反,TET1CD-dCas9融合体显示比其相应的C-末端融合体弱得多的激活,表明当与dCas9或PUFa蛋白N-末端融合时影响TET1活性的可能的空间位阻图3B和3C。为了比较用dCas9-TET1获得的hMLH1激活与转录激活因子的hMLH1激活,HEK293T细胞用dCas9-p65HSF1以及相同的sgRNA组合转染。mRNA水平的分析显示hMLH1的dCas9-TET1激活最多是用转录激活因子dCas9融合体获得的活性的两倍图3C,因此表明靶向特定基因座的TET1可以激活基因,可能是通过改变靶位点处的表观遗传DNA甲基化。然而,用Casilio-ME获得的hMLH1激活比用dCas9-TET1CD直接融合体获得的激活显著更高效,表明Casilio-ME平台作为解译胞嘧啶高甲基化在许多生物和病理系统中的影响的有效和可适应性工具的巨大潜力。Casilio-介导的去甲基化酶的递送改变了靶向的基因组基因座的甲基化状态。所显示的Casilio-ME诱导的hMLH1转录的激活是靶向的启动子区域内TET1介导的胞嘧啶去甲基化的结果的证据来自亚硫酸氢盐转化后hMLH1启动子的DNA测序。基因组DNA的亚硫酸氢盐处理使未甲基化的胞嘧啶脱氨基以产生尿嘧啶,其随后复制为胸腺嘧啶。然而,甲基化胞嘧啶被保护免于转化为尿嘧啶,因此允许通过直接测序以单核苷酸分辨率确定胞嘧啶甲基化状态。为了评估在Casilio-ME介导的转录激活后hMLH1启动子区域内CpG岛的甲基化状态的变化,进行时程实验,其中在转染后3、4、5和6天收集细胞用于分析胞嘧啶甲基化以及转录激活和蛋白质表达。HEK293T细胞用Casilio-ME组分转染,其包括Ct-融合PUFa-TET1效应子和2个sgRNA的组合RNA指导3和7。TaqMan分析显示在这些瞬时转染过程中维持了hMLH1转录的激活图4A,因此显示在6天的实验期间hMLH1mRNA水平的持续变化。在提取的基因组DNA的亚硫酸氢盐处理后克隆的hMLH1启动子DNA片段的测序和随后的PCR扩增显示hMLH1启动子内CpG的甲基化形势的显著变化,如由Casilio-ME靶向所诱导的亚硫酸氢盐转化的频率增加所表明的图4C。虽然使用未转染的HEK293T细胞没有获得显著的胞嘧啶至尿嘧啶的转化,如对于高甲基化DNA所预期的,但转染的HEK293T细胞显示出显著的去甲基化频率,接近靶向RNA的结合位点观察到最高活性图4C箭头。Casilio-ME介导的去甲基化活性在实验过程中持续,并且似乎从指导RNA的结合位点扩散300pb,尽管具有相对较弱的活性。在对照实验中,还分析了其hMLH1启动子被低甲基化和为转录活性的未转染HEK293细胞。如图4C黑色柱所示,测序的区域显示出如预期的高胞嘧啶转化频率。还分析了用5'-氮杂胞苷AzaC药物胞嘧啶甲基转移酶的抑制剂处理6天的未转染HEK293T细胞。这也显示在启动子区域内的多个CpG位点上的亚硫酸氢盐转化频率增加图4C,紫色柱。为了确定Casilio-ME靶向对MLH1蛋白质合成的影响,使用抗hMLH1单克隆抗体对从HEK293T转染细胞以及未转染HEK293和AzaC处理的HEK293T细胞提取的总蛋白质进行Western印迹分析。结果显示转染的细胞产生可检测量的MLH1蛋白,其在转染后第5天和第6天达到较高水平图4B。然而,转染细胞产生的MLH1的量显著低于组成型表达hMLH1的HEK293细胞产生的蛋白质水平。Casilio-ME介导的MLH1合成的诱导仍然是显著的,并且可以通过例如重叠多个指导RNA以增强CpG去甲基化的范围和效率而实现更好的hMLH1表达激活来改善。考虑到Casilio-ME将TET1活性递送至hMLH1启动子区域激活转录以及相关CpG岛的甲基化状态的急剧诱导的变化的事实,该发现提供了Casilio-ME是编辑表观基因组的甲基胞嘧啶标记的稳定平台的主要证据。该技术为以高分辨率解决甲基胞嘧啶表观基因组标记在许多生物和病理系统中的因果关系的研究调查的新领域铺平了道路。Casilio-介导的甲基转移酶的递送沉默基因表达。通过Dnmt3a、Dnmt3L或杂合Dnmt3a-3L的催化结构域与dCas9的N-末端或C-末端的直接融合来构建可编程甲基转移酶图5A。还构建了这些效应子与PUFα的N-或C-末端融合用于与dCas9和sgRNA-PBS具有Dnmt效应子的Casilio-ME;图5B一起使用。与直接融合相比,具有Dnmt3a-PUF的Casilio-ME实现了更稳定的SOX2基因表达的抑制,证明了使用Casilio-ME进行定向DNA甲基化的优异活性图6A和6B。材料和方法通过Tet1效应子的DNA去甲基化细胞培养和转染。将HEK293T细胞在设置为37℃和5%CO2的培养箱中含有10%胎牛血清FBSLonza、4%GlutamaxGibco、1%丙酮酸钠Gibco和青霉素-链霉素Gibco的Dulbecco改良Eagle培养基DMEMSigma中培养。当指示时细胞用2.5μM或5μM5-氮杂胞苷sigma处理,每天更换含有新鲜稀释药物的培养基。在根据制造商的说明书Qiagen用100ngdCas9构建体、100ng修饰的sgRNA构建体和200ngPUF-融合体与Attractene转染试剂转染的前一天,将细胞以每孔150,000个细胞接种到12孔板中。在dCas9-直接融合实验中,细胞用200ngdCas9-融合构建体和200ng修饰的sgRNA构建体转染。转染后60小时或如另外指示地收获转染的细胞,并使用细胞沉淀提取RNA、基因组DNA和蛋白质。定量RT-PCR分析。收获细胞,用Dulbecco磷酸盐缓冲盐水dPBS洗涤,以125×g离心5分钟,然后将速冻的沉淀储存在-80℃下。使用RNeasyPlusMiniKit根据制造商的说明书Qiagen提取RNA。使用AppliedBiosystemsHighCapacityRNA-to-cDNA试剂盒以200ng至1μgRNA制备cDNA文库。使用GAPDHHs03929097,VIC作为内源对照和hMLH1Hs00179866,FAM作为靶标设计TaqMan基因表达分析AppliedBiosystems。将具有UNG的TaqManUniversalMasterMixIIAppliedBiosystems用于定量PCRqPCR,2μl稀释的cDNA用于每个反应。激活用AppliedBiosystemsViiA7仪器分析。通过“ΔΔCt”算法计算基因表达水平,并将其针对对照样品标准化。亚硫酸氢盐转化和测序。使用所有AllPrepDNARNAProteinMiniKit根据制造商的说明书Qiagen提取基因组DNA。该试剂盒允许从相同的细胞沉淀中提取基因组DNA以及RNA和总蛋白用于平行的下游分析。根据制造商的说明书使用EpiTectFastDNABisulfiteKitQiagen和提取的基因组DNA进行亚硫酸氢盐转化实验。亚硫酸氢盐处理的DNA然后用作模板以根据制造商的说明书使用ZymoTaqPreMixZymoResearchPCR扩增两个350-400bp长的DNA片段,其覆盖整个hMLH1启动子区域。然后使用T4DNA聚合通过SLIC将PCR片段克隆到EcoRI-线性化的PUC19质粒中Jeong,JY.等,One-stepsequence-andligation-independentcloningasarapidandversatilecloningmethodforfunctionalgenomicsstudies.ApplEnvironMicrobiol,2012.7815:p.5440-3。然后对每个样品的六个独立阳性克隆进行Singer测序以测定hMLH1启动子区域的单个CpG处胞嘧啶-胸腺嘧啶转化的频率。Western印迹分析。来自细胞提取物30μg的蛋白质通过在10%SDS-聚丙烯酰胺凝胶上的电泳分离,然后使用BjerrumSchafer-NielsenBuffer及SDS在100V下转移至硝酸纤维素膜1小时。然后将在TBS-T中的5%Blotting-GradeBlockerBioRad中封闭的膜与指示的抗体在4℃下孵育过夜,并使用辣根过氧化物酶偶联的二抗和ClarityWesternECL底物根据制造商的说明BioRad检测蛋白质条带。使用G:BoxSyngene对凝胶进行成像。通过Dnmt效应子的DNA甲基化表达dCas9的细胞系的建立。在转染前一天,将Lenti-X293T细胞以每孔120万个细胞接种到6孔板中。细胞用超螺旋包装质粒pLP1gagpol、pLP2rev和VSV-G包膜和dCas9慢病毒表达质粒通过Lipofectamine3000试剂Invitrogen转染。在转染后6小时,将培养基更换为新鲜的。在转染后24小时,收集2ml含有慢病毒的培养基并以2,000rpm离心10分钟以除去细胞碎片。使用45μm孔隙过滤器Millipore过滤上清液,并将慢病毒在-80℃下冷冻直至需要。以每孔150,000个细胞接种到12孔板中的HEK293T细胞在补充有5μgml聚凝胺的培养基中用500μl的dCas9慢病毒转导12小时,随后在转导后第三天用杀稻瘟素抗生素选择。转染。将HEK293T和HEK293TdCas9细胞系以每孔150,000个细胞接种到12孔板中。用200ng的Dnmt效应子构建体和200ng的sgRNA-PBS与Attractene转染试剂Qiagen转染细胞。在转染后3天,用荧光激活细胞分选FACS对细胞进行GFP分选sgRNA表达构建体通过GFP标记,并重新接种到12或24孔板中。定量逆转录PCR。转染后7-10天用100μl胰蛋白酶,500μlDMEM和500μlDulbecco磷酸盐缓冲盐水dPBS收获细胞,并以700g离心5分钟。使用RNeasyPlusMiniKitQiagen从沉淀的细胞提取RNA。使用AppliedBiosystemsHighCapacityRNA-to-cDNA试剂盒和2μgRNA进行cDNA合成。用GAPDH作为内源对照和SOX2作为靶标完成TaqMan基因表达分析AppliedBiosystems。序列靶向MLH1和SOX2基因的sgRNA间隔区序列的列表。蛋白质序列的列表蛋白质序列的列表实施例11.使用可编程Casilio和dCas9-系留酶的靶向DNA去甲基化和甲基化甲基胞嘧啶mC从基因组DNA的主动擦除涉及TET1介导的迭代mC氧化,以及随后将氧化中间体转化为未甲基化胞嘧啶的碱基切除修复BER或核苷酸切除修复NER途径。有趣的是,mC去甲基化效率似乎通过GADD45A蛋白生长阻滞和DNA损伤诱导α增强,这是一个参与基因组稳定性的维持、DNA修复和细胞生长的抑制的多方面核因子Niehrs和Schafer,TrendsCellBiol224:220-227,2012;Barreto等,Nature4457128:671-675,2007;Schuermann等,DNARepairAmst44:92-102,2016。还发现GADD45A与TET1和与BER酶胸腺嘧啶DNA糖基化酶TDG相互作用Kienhofer等,Differentiation901-3:59-68,2015;Li等,NucleicAcidsRes438:3986-3997,2015。为了提高我们最近开发的Casilio-ME平台使靶向的基因组基因座去甲基化的效率,我们寻求通过使TET1催化结构域和GADD45A能够同时募集到特定基因组基因座来简化mC擦除过程而增强Casilio-ME。在TET1CD附近存在GADD45A或在靶向基因组位点处作为与TET1CD蛋白的融合体刺激TET1活性和或募集DNA修复机制的关键参与者以有效地将mC氧化与DNA修复偶联,且与单独的靶向TET1CD相比,Casilio-ME双重靶向的结果导致基因表达的更大改变。结果因此,我们制备编码与PUFa-TET1CD融合的GADD45A蛋白质的质粒图7A,并测量相对于用单独PUFa-TET1CD获得的hMLH1激活,在每种GADD45A蛋白质融合体存在下hMLH1表达的激活效率。这表明在存在六个指导RNA的情况下PUFa-TET1CD效应子显示出hMLH1表达的显著激活,其比用转录激活因子效应子p65HSF1获得的激活高30%图7B和7C第3和8列。有趣的是,当GADD45A通过PUFa结构域与TET1CD效应子融合以产生GADD45A-PUFa-TET1CD时,hMLH1表达增强约9倍图7A和7C第3和5列,如通过TaqMan测定中增加的相对表达所示的。同时,当GADD45A与PUFa-GADD45A-TET1CD效应子中的TET1CD直接融合时,hMLH1激活仅增强4倍图7C第3和4列,表明当存在于效应子融合体的N-末端时GADDA45A更多地暴露,以形成所需的相互作用来刺激TET1和或下游DNA修复活性。这确实显示了利用GADD45A和TET1CD作为二合一效应子显著提高Casilio-ME介导的基因激活的效率的主要证据。激活可能是由TET1CD组分的增强活性和或mC氧化与恢复未甲基化胞嘧啶的DNA修复途径的有效偶联介导的。将两种组分GADD45A和TET1CD双重靶向于基因组位点以改变其甲基化状态和相关的基因表达的另一种方法是将蛋白质与两个独立的PUF融合,例如用于TET1CD的PUFa和用于GADD45A的PUFc,并使用包含相应PUF结合位点PBS的修饰的gRNA支架图7A。在相应的gRNA-PBSac存在下PUFa-TET1CD和PUFc-GADD45A的双重表达显示出对TET1CD介导的hMLH1激活的显著刺激,其中GADD45A-PUFc显示出与PUFc-GADD45A融合体相比更高的活性图7E,第4、5、6列。当Flag标签附加到GADD45A融合体时获得了类似的趋势图7E,第4、11、12列。然而,当在催化性死亡的TET1CDH1671YD1673A-PUFa融合体存在下表达GADD45A时,未检测到hMLH1表达,表明获得的GADD45A介导的基因激活的刺激需要TET1的氧化活性。类似地,当在没有TET1CD融合体的情况下表达GADDA45A融合体时,未检测到活性,表明单独的GADD45A不介导观察到的基因激活。此外,当GADD45APUFc融合体与PUFa-TET1CD和仅含有PBSa的gRNA共表达时,没有获得基因激活的额外刺激图7D。总之,数据表明Casilio介导的GADD45A的靶向刺激了TET1介导的基因激活,并且该刺激取决于TET1活性及GADD45A和TET1CD通过RNA支架的紧密接近的系留。总之,使用Casilio平台对TET1CD和GADD45A的双重靶向通过提供二合一效应子使得能够显著改变基因激活,据推测所述效应子允许刺激甲基化状态改变所需的TET1的氧化活性及将未甲基化胞嘧啶恢复到靶基因组位点所必需的DNA修复途径的关键参与者的募集。值得注意的是,可以通过仅改变效应子GADD45A和TET1CD融合体的构型和类型获得甲基化沉默基因的不同激活水平,其中GADD45A-PUFa-TET1CD提供最高活动。这为我们的Casilio-ME平台提供了微调基因激活以达到所需的表达水平而恢复表型或逆转与高甲基化沉默基因相关的疾病状态的独特的能力。GADD45A介导Casilio-ME激活增强以激活甲基化沉默基因与增加的MLH1蛋白合成相关的证据来自使用抗hMLH1单克隆抗体的全细胞提取物的Western印迹分析。这显示在表达GADD45A-TET1CD融合体的细胞中可检测量的MLH1蛋白质,其中GADD45A-PUFa-TET1CD显示出较高的蛋白质量,如通过条带强度所示的图7D。这与TaqMan测定中获得的不同刺激水平一致。相反,表达单独的PUFa-TET1CD融合体的细胞在转染后3天收集这些转染细胞时未显示任何可检测量的MLH1我们之前证明使用PUFa-TET1CD介导的激活,需要5天孵育以检测显著量的MLH1图7C和7E。该数据一起证明向Casilio-ME平台添加GADD45A提高其激活甲基化沉默基因的效率。序列列表靶向MLH1基因的sgRNA间隔区序列和编码具有PBSac的gRNA支架的序列的列表。以下提供用于这一实施例中的蛋白质序列的列表。实施例12.使用可编程Casilio和dCas9-系留的酶的靶向DNA去甲基化和甲基化甲基胞嘧啶是通过在CpGDNA序列的胞嘧啶环的5位处共价添加甲基的过程形成的表观遗传标记。在哺乳动物细胞中,5-甲基胞嘧啶5mC标记的形成由DNA甲基转移酶催化和维持。去除甲基以恢复未甲基化DNA的去甲基化途径涉及10-11易位TET蛋白质家族。TET甲基胞嘧啶双加氧酶催化5mC至5-羟甲基胞嘧啶5hmC、5-甲酰基胞嘧啶5fC和5-羧基胞嘧啶5caC中间体的迭代氧化。后两种中间体5fC和5caC似乎充当碱基切除修复BER机构的底物,该机构切除氧化的碱基并用未甲基化的胞嘧啶取代它。DNA糖基化酶催化切除受损的碱基并产生脱嘌呤脱嘧啶位点AP位点底物的初始和重要步骤,该底物随后由BER机构处理以恢复碱基。基于胸腺嘧啶DNA糖基化酶TDG的BER途径在功能上与TET1介导的主动去甲基化相关联,因为它们已经显示出特异性地作用于5fC和5caC,并且NEIL1和NEIL2糖基化酶AP-裂解酶活性通过从AP位点置换TDG来产生用于BER机构的下游处理的单链DNA断裂底物而促进未甲基化胞嘧啶的恢复。我们使用我们先前开发的Casilio-ME其基于我们的原始Casilio平台构建,其使得能够靶向递送TET1活性以同时递送TET1和DNA糖基化酶效应子至hMLH1启动子区域的CpG岛并通过使用甲基化沉默基因的激活作为读数来比较去甲基化的效率。我们证明在测试的DNA糖基化酶效应子,TDG、NEIL1、NEIL2和NEIL3中,只有NEIL2增强TET1介导的hMLH1激活。当NEIL2作为单一蛋白融合体或作为单独的效应子与TET1共同递送时,我们获得了稳定的基因激活增强。NEIL2增强TET1介导的基因激活的能力需要将NEIL2效应子靶向于启动子区域。使用简单且可编程的Casilio平台将TET1氧化活性与NEIL2糖基化酶AP-裂解酶活性偶联能够实现稳定的去甲基化介导的甲基化沉默基因的转录激活,从而提供了Casilio平台允许利用独立途径的参与者以协同他们的关联活性的前所未有特征的主要证据。这一发现增强了我们的Casilio-ME平台的能力,并为开发研究重要生物学过程的新应用以及开发甲基化相关疾病的新疗法铺平了道路。结果Casilio-介导的TET1和DNA糖基化酶作为二合一效应子的共同递送在本研究中,我们确定了DNA糖基化酶和TET1TET1CD的催化结构域共同递送至靶向的基因组基因座是否可能具有协同效应并增强TET1介导的基因激活。我们制备了基于Casilio的质粒,其编码与PUFa-TET1CD的DNA糖基化酶蛋白融合体图8A,8C。然后我们测量了用PUFa-TET1CD或用编码DNA糖基化酶蛋白融合体NEIL1、NEIL2、NEIL3或TDG的每种质粒转染的细胞中hMLH1激活的效率。我们证明PUFa-TET1CD效应子如预期的那样激活hMLH1表达图8B白色柱。然而,令人惊讶的是,只有NEIL2效应子融合体显示hMLH1的激活增强图8B,4和5列。与此形成鲜明对比的是,TDG、NEIL1和NEIL3效应子融合体对hMLH1的激活没有任何增强作用图8B,D。在NEIL2存在的情况下,hMLH1的激活比单独用TET1效应子获得的高3倍,而分别用NEIL1、NEIL3和TDG没有获得激活或有抑制作用。该数据显示NEIL2而非NEIL1和NEIL3特异性相关活性促进5mC擦除过程,导致更高的基因激活。为了证实用NEIL2糖基化酶AP裂解酶获得的协同效应,我们进行了实验以包括非靶向指导RNAgRNA作为特异性的对照。如图9A-9B所示,当NEIL2存在于PUFa-TET1CD融合体中时,获得了基因激活的四倍增加,如TaqMan测定中增加的相对表达所示的。无论NEIL2是否与PUFα氨基或羧基末端融合,都获得了类似的激活图9A,9B。相反,当非靶向gRNA替换hMLH1gRNA时未获得激活,表明对于观察到的激活需要效应子特异性靶向至MLH1启动子区域图9B。这提供了利用NEIL2和TET1CD作为二合一效应子显著提高了Casilio-ME介导的基因激活的效率的证据。我们推测观察到的MLH1激活效率的增加可能是由TET1的mC氧化与NEIL2介导的BER途径的有效偶联介导的,以简化靶向位点上未甲基化胞嘧啶的恢复。Casilio-介导的TET1和NEIL2作为独立效应子模块的共同递送使用Casilio平台,我们检验了将TET1CD和NEIL2效应子双重靶向于基因组位点以将这些酶系留到被编程以结合不同的RNA序列的两个独立的PUF蛋白上的另一种方法。为此,我们将TET1CD与PUFa和NEIL2与PUFc融合,并使用包含同源PUF结合位点PBSa和PBSc的修饰的gRNA支架图10A。在具有PBSac两者的gRNA存在下PUFa-TET1CD和PUFc-NEIL2的双重表达显示出对TET1CD介导的hMLH1激活的显著刺激图10B。当与PUFc的任一末端融合时,NEIL2显示出hMLH1表达增加7倍,如RT-定量PCR所示的图10B。NEIL2介导的刺激需要效应子的共同靶向的证据来自其中NEIL2和TET1CDPUF-融合体在包含PBSa但缺乏PBSc的gRNA支架的存在下表达的实验图11A。该数据显示,当gRNA缺乏PBSc时,NEIL2和TET1效应子的共表达对TET1介导的基因激活没有影响图11B,表明获得的协同效应不是来自过表达NEIL2的一般效应,而是需要将其靶向于TET1效应子近处,以实现其相关活性的偶联和有效的mC擦除和基因激活。总之,本数据清楚地表明,Casilio介导的NEIL2靶向刺激TET1介导的基因激活,其方式需要将NEIL2和TET1紧密桥接以作为单链融合或通过PUF介导的与RNA支架的结合。使用NEIL2独立模块实现较高水平的激活,从而通过使用NEIL2TET1效应子作为二合一或独立效应模块来调节基因活性的手段。总之,使用Casilio平台的TET1CD和NEIL2的双重靶向通过提供NEIL2效应模块实现基因激活的显著改变,所述NEIL2效应模块推测允许TET1氧化活性与BER的NEIL2起始的偶联,导致随后将未甲基化的胞嘧啶恢复到靶向基因组位点所必需的DNA修复途径的关键参与者的募集。材料和方法细胞培养和转染将HEK293T细胞在含有10%胎牛血清FBSLonza,4%GlutamaxGibco,1%丙酮酸钠Gibco和青霉素-链霉素Gibco的Dulbecco改良Eagle培养基Sigma中培养。在设置为37℃和5%CO2的培养箱中,在根据制造商的说明书Qiagen用100ngdCas9构建体、100ng经修饰的sgRNA构建体和200ngPUF-融合体与Attractene转染试剂转染之前,将细胞以每孔150,000个细胞接种到12孔板中。转染后3天或如其他方式指示的收获转染的细胞,并将细胞沉淀用于RNA提取。定量RT-PCR分析收获细胞,用Dulbecco磷酸盐缓冲盐水dPBS洗涤,以125×g离心5分钟,然后将快速冷冻的沉淀储存在-80℃。使用RNeasyPlusMiniKit根据制造商的说明书Qiagen提取RNA。使用AppliedBiosystemsHighCapacityRNA-to-cDNA试剂盒以200ng至2μgRNA制备cDNA文库。使用GAPDHHs03929097,VIC作为内源对照和hMLH1Hs00179866,FAM作为靶标设计TaqMan基因表达测定AppliedBiosystems。将具有UNG的TaqManUniversalMasterMixIIAppliedBiosystems用于定量PCRqPCR,每个反应使用2μl稀释的cDNA。用AppliedBiosystemsViiA7仪器分析激活。通过“ΔΔCt”算法计算基因表达水平,并将其相对于对照样品标准化。序列靶向hMLH1基因的sgRNA间隔区序列和编码具有PBSa和PBSc的gRNA支架的序列的列表。蛋白质序列的列表参考文献BarretoG.,A.,MarholdJ.,StachD.,SwaminathanS.K.,HandaV.,DoderleinG.,MaltryN.,WuW.,LykoF.,NiehrsC.Gadd45apromotesepigeneticgeneactivationbyrepair-mediatedDNAdemethylation.Nature.2007;445:671–675.LeMayN.,Mota-FernandesD.,Velez-CruzR.,IltisI.,BiardD.,EglyJ.M.NERfactorsarerecruitedtoactivepromotersandfacilitatechromatinmodificationfortranscriptionintheabsenceofexogenousgenotoxicattack.Mol.Cell.2010;38:54–66SchmitzK.M.,SchmittN.,Hoffmann-RohrerU.,A.,GrummtI.,MayerC.TAF12recruitsGadd45aandthenucleotideexcisionrepaircomplextothepromoterofrRNAgenesleadingtoactiveDNAdemethylation.Mol.Cell.2009;33:344–353KriaucionisS.,HeintzN.ThenuclearDNAbase5-hydroxymethylcytosineispresentinPurkinjeneuronsandthebrain.Science.2009;324:929–930MaitiA.,DrohatA.C.ThymineDNAglycosylasecanrapidlyexcise5-formylcytosineand5-carboxylcytosine:potentialimplicationsforactivedemethylationofCpGsites.J.Biol.Chem.2011;286:35334–35338.HeY.F.,LiB.Z.,LiZ.,LiuP.,WangY.,TangQ.,DingJ.,JiaY.,ChenZ.,LiL.,SunY.,LiX.,DaiQ.,SongC.X.,ZhangK.,HeC.,XuG.L.Tet-mediatedformationof5-carboxylcytosineanditsexcisionbyTDGinmammalianDNA.Science.2011;333:1303–1307.Ito,S.等,RoleofTetproteinsin5mCto5hmCconversion,ES-cellself-renewalandinnercellmassspecification.Nature,2010.4667310:p.1129-33.Kienhofer,S.等,GADD45aphysicallyandfunctionallyinteractswithTET1.Differentiation,2015.901-3:p.59-68.Muller,U.等,TET-mediatedoxidationofmethylcytosinecausesTDGorNEILglycosylasedependentgenereactivation.NucleicAcidsRes,2014.4213:p.8592-604.

权利要求:1.一种去甲基化复合物,其包含:a核糖核蛋白复合物,其包括:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,包含:1与靶多核苷酸序列互补的DNA靶向序列;2所述核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和3一个或多个PUF结合位点PBS序列,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶通过所述结合序列与所述多核苷酸结合;和b去甲基化蛋白缀合物,其包含:i具有C-末端和N-末端的PUF结构域;ii与所述PUF结构域的C-末端可操作地连接的TET去甲基化结构域;和iii与所述PUF结构域的N-末端可操作地连接的去甲基化增强子结构域,以形成蛋白质缀合物,和其中所述去甲基化蛋白缀合物通过所述PUF结构域与所述一个或多个PBS序列的结合而与所述核糖核蛋白复合物结合以形成去甲基化复合物。2.权利要求1的复合物,其中所述TET去甲基化结构域是TET1结构域、TET2结构域或TET3结构域。3.权利要求2的复合物,其中所述TET1结构域具有SEQIDNO:51的序列。4.权利要求1-3之一的复合物,其中所述去甲基化增强子结构域是生长阻滞和DNA损伤诱导αGADD45A结构域。5.权利要求4的复合物,其中所述GADD45结构域具有SEQIDNO:85的氨基酸序列。6.权利要求1-3之一的复合物,其中所述去甲基化增强子结构域是NEIL2结构域。7.权利要求5的复合物,其中所述NEIL2结构域具有SEQIDNO:86的氨基酸序列。8.权利要求1-7之一的复合物,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶包含核定位信号NLS。9.权利要求1-8之一的复合物,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶是dCas9。10.权利要求1-9之一的复合物,其中所述靶多核苷酸序列是基因的部分。11.权利要求1-9之一的复合物,其中所述靶多核苷酸序列是转录调控序列的部分。12.权利要求1-9或11之一的复合物,其中所述靶多核苷酸序列是启动子、增强子或沉默子的部分。13.权利要求1-12之一的复合物,其中所述靶多核苷酸序列是高甲基化核酸序列。14.权利要求1-13之一的复合物,其中所述靶多核苷酸序列是高甲基化的CpG序列。15.权利要求1-9或11-14之一的复合物,其中所述靶多核苷酸序列是hMLH1启动子的部分。16.权利要求1-10或13-14之一的复合物,其中所述靶多核苷酸序列是Sox基因的部分。17.权利要求1-16之一的复合物,其中所述一个或多个PBS序列包含8个核苷酸的长度。18.权利要求1-17之一的复合物,其中所述一个或多个PBS序列是相同的。19.权利要求1-18之一的复合物,其中所述多核苷酸包含1-50个PBS序列。20.权利要求1-19之一的复合物,其中一个或多个PBS序列包含SEQIDNO:1的核苷酸序列。21.权利要求1-20之一的复合物,其中所述PUF结构域包含PUFa结构域、PUFb结构域、PUFc结构域或PUFw结构域。22.权利要求21的复合物,其中所述PUFa结构域具有SEQIDNO:2的氨基酸序列。23.权利要求21的复合物,其中所述PUFb结构域具有SEQIDNO:3的氨基酸序列。24.权利要求21的复合物,其中所述PUFc结构域具有SEQIDNO:4的氨基酸序列。25.权利要求21的复合物,其中所述PUFw结构域具有SEQIDNO:5的氨基酸序列。26.一种使哺乳动物细胞中的靶核酸序列去甲基化的方法,包括:a提供含有需要去甲基化的靶核酸的哺乳动物细胞;b向所述哺乳动物细胞递送编码核酸酶缺陷的RNA指导DNA核酸内切酶的第一多核苷酸;c向所述哺乳动物细胞递送第二多核苷酸,该第二多核苷酸包含:i与靶多核苷酸序列互补的DNA靶向序列;ii所述核酸酶缺陷型RNA指导DNA核酸内切酶的结合序列,和iii一个或多个PUF结合位点PBS序列,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶通过所述结合序列与所述第二多核苷酸结合;d向所述哺乳动物细胞递送编码去甲基化蛋白缀合物的第三多核苷酸,该去甲基化蛋白缀合物包含:i具有C-末端和N-末端的PUF结构域;ii与所述PUF结构域的C-末端可操作地连接的TET去甲基化结构域;和iii与所述PUF结构域的N-末端可操作地连接以形成蛋白质缀合物的去甲基化增强子结构域,和其中所述递送的去甲基化蛋白缀合物使所述细胞中的所述靶核酸序列去甲基化。27.权利要求26的方法,其中所述去甲基化蛋白缀合物通过所述PUF结构域与所述一个或多个PBS序列结合而与所述核糖核蛋白复合物结合以形成去甲基化复合物。28.权利要求26或27的方法,其中所述第一多核苷酸包含在第一载体内。29.权利要求26-28之一的方法,其中所述第二多核苷酸包含在第二载体内。30.权利要求26-29之一的方法,其中所述第三多核苷酸包含在第三载体内。31.权利要求26-30之一的方法,其中所述第一、第二或第三载体是相同的。32.权利要求26-31之一的方法,其中所述递送通过转染进行。33.一种试剂盒,包括:i权利要求1-25之一的核糖核蛋白复合物或编码它的核酸;和ii权利要求1-25之一的去甲基化蛋白缀合物或编码它的核酸。34.如权利要求33所述的试剂盒,还包含转染剂。35.如权利要求33或34所述的试剂盒,还包括用于从癌症患者收集样品的样品收集装置。36.一种去甲基化复合物,其包含:a核糖核蛋白复合物,包含:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,其包含:1与靶多核苷酸序列互补的DNA靶向序列;2所述核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;和3一个或多个PUF结合位点PBS序列,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶通过所述结合序列与所述多核苷酸结合;和b去甲基化蛋白缀合物,其包含:i具有C-末端的PUF结构域;ii具有N-末端和C-末端的去甲基化增强子结构域,其中所述去甲基化增强子结构域的所述N-末端可操作地连接到所述PUF结构域的C-末端;和iii与所述去甲基化增强子结构域的C-末端可操作地连接的TET去甲基化结构域;和其中所述去甲基化蛋白缀合物通过所述PUF结构域与所述一个或多个PBS序列结合而与所述核糖核蛋白复合物结合以形成去甲基化复合物。37.权利要求36的复合物,其中所述TET去甲基化结构域是TET1结构域、TET2结构域或TET3结构域。38.权利要求37的复合物,其中所述TET1结构域具有SEQIDNO:51的序列。39.权利要求36-38之一的复合物,其中所述去甲基化增强子结构域是生长阻滞和DNA损伤诱导αGADD45A结构域。40.权利要求39的复合物,其中所述GADD45结构域具有SEQIDNO:85的氨基酸序列。41.权利要求36-38之一的复合物,其中所述去甲基化增强子结构域是NEIL2结构域。42.权利要求41的复合物,其中所述NEIL2结构域具有SEQIDNO:86的氨基酸序列。43.权利要求36-42之一的复合物,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶包含核定位信号NLS。44.权利要求36-43之一的复合物,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶是dCas9。45.权利要求36-44之一的复合物,其中所述靶多核苷酸序列是基因的部分。46.权利要求36-44之一的复合物,其中所述靶多核苷酸序列是转录调控序列的部分。47.权利要求36-44或46之一的复合物,其中所述靶多核苷酸序列是启动子、增强子或沉默子的部分。48.权利要求36-47之一的复合物,其中所述靶多核苷酸序列是高甲基化核酸序列。49.权利要求36-48之一的复合物,其中所述靶多核苷酸序列是高甲基化的CpG序列。50.权利要求36-44或46-49之一的复合物,其中所述靶多核苷酸序列是hMLH1启动子的部分。51.权利要求36-45或48-49之一的复合物,其中所述靶多核苷酸序列是Sox基因的部分。52.权利要求36-51之一的复合物,其中所述一个或多个PBS序列包含8个核苷酸的长度。53.权利要求36-52之一的复合物,其中所述一个或多个PBS序列是相同的。54.权利要求36-53之一的复合物,其中所述多核苷酸包含1-50个PBS序列。55.权利要求36-54之一的复合物,其中一个或多个PBS序列包含SEQIDNO:1的核苷酸序列。56.权利要求36-55之一的复合物,其中所述PUF结构域包含PUFa结构域、PUFb结构域、PUFc结构域或PUFw结构域。57.权利要求56的复合物,其中所述PUFa结构域具有SEQIDNO:2的氨基酸序列。58.权利要求56的复合物,其中所述PUFb结构域具有SEQIDNO:3的氨基酸序列。59.权利要求56的复合物,其中所述PUFc结构域具有SEQIDNO:4的氨基酸序列。60.权利要求56的复合物,其中所述PUFw结构域具有SEQIDNO:5的氨基酸序列。61.一种使哺乳动物细胞中的靶核酸序列去甲基化的方法,其包括:a提供含有需要去甲基化的靶核酸的哺乳动物细胞;b向所述哺乳动物细胞递送编码核酸酶缺陷的RNA指导DNA核酸内切酶的第一多核苷酸;c向所述哺乳动物细胞递送第二多核苷酸,该第二多核苷酸包含:i与靶多核苷酸序列互补的DNA靶向序列;ii所述核酸酶缺陷型RNA指导DNA核酸内切酶的结合序列;和iii一个或多个PUF结合位点PBS序列,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶通过所述结合序列与所述第二多核苷酸结合;d向所述哺乳动物细胞递送编码去甲基化蛋白缀合物的第三多核苷酸,该去甲基化蛋白缀合物包含:i具有C-末端的PUF结构域;ii具有N-末端和C-末端的去甲基化增强子结构域,其中所述去甲基化增强子结构域的所述N-末端可操作地连接到所述PUF结构域的C-末端;和iii与所述去甲基化增强子结构域的C-末端可操作地连接的TET去甲基化结构域,其中所述递送的去甲基化蛋白缀合物使所述细胞中的所述靶核酸序列去甲基化。62.权利要求61的方法,其中所述去甲基化蛋白缀合物通过所述PUF结构域与所述一个或多个PBS序列结合而与所述核糖核蛋白复合物结合以形成去甲基化复合物。63.权利要求61或62的方法,其中所述第一多核苷酸包含在第一载体内。64.权利要求61-63之一的方法,其中所述第二多核苷酸包含在第二载体内。65.权利要求61-64之一的方法,其中所述第三多核苷酸包含在第三载体内。66.权利要求61-65之一的方法,其中所述第一、第二或第三载体是相同的。67.权利要求61-66之一的方法,其中所述递送通过转染进行。68.一种试剂盒,包括:i权利要求36-60之一的核糖核蛋白复合物或编码它的核酸;和ii权利要求36-60之一的去甲基化蛋白缀合物或编码它的核酸。69.权利要求68的试剂盒,还包括转染剂。70.如权利要求68或69所述的试剂盒,还包括用于从癌症患者收集样品的样品收集装置。71.一种去甲基化复合物,其包含:a核糖核蛋白复合物,包含:i核酸酶缺陷的RNA指导DNA核酸内切酶;和ii多核苷酸,其包含:1与靶多核苷酸序列互补的DNA靶向序列;2所述核酸酶缺陷的RNA指导DNA核酸内切酶的结合序列;3第一PUF结合位点PBS序列;和4第二PUF结合位点PBS序列,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶通过所述结合序列与所述多核苷酸结合;b去甲基化蛋白缀合物,其包含:i具有C-末端的第一PUF结构域,和ii与所述第一PUF结构域的C-末端可操作地连接的TET去甲基化结构域,其中所述去甲基化蛋白缀合物通过所述第一PUF结构域与所述第一PBS序列结合而与所述核糖核蛋白复合物结合;和c去甲基化增强子缀合物,其包含:i第二PUF结构域;和ii与所述第二PUF结构域可操作地连接的去甲基化增强子结构域,其中所述去甲基化增强子缀合物通过所述第二PUF结构域与所述第二PBS序列结合而与所述核糖核蛋白复合物结合以形成去甲基化复合物。72.权利要求71的复合物,其中所述TET去甲基化结构域是TET1结构域、TET2结构域或TET3结构域。73.权利要求72的复合物,其中所述TET1结构域具有SEQIDNO:51的序列。74.权利要求71-73之一的复合物,其中所述去甲基化增强子结构域是生长阻滞和DNA损伤诱导αGADD45A结构域。75.权利要求74的复合物,其中所述GADD45结构域具有SEQIDNO:85的氨基酸序列。76.权利要求71-73之一的复合物,其中所述去甲基化增强子结构域是NEIL2结构域。77.权利要求76的复合物,其中所述NEIL2结构域具有SEQIDNO:86的序列。78.权利要求71-77之一的复合物,其中所述第一PUF结构域是PUFa结构域。79.权利要求78的复合物,其中所述PUFa结构域具有SEQIDNO:2的序列。80.权利要求71-79之一的复合物,其中所述第二PUF结构域是PUFc结构域。81.权利要求80的复合物,其中所述PUFc结构域具有SEQIDNO:4的序列。82.权利要求71-81之一的复合物,其中所述去甲基化增强子结构域可操作地连接到所述第二PUF结构域的N-末端。83.权利要求71-81之一的复合物,其中所述去甲基化增强子结构域与所述第二PUF结构域的C-末端可操作地连接。84.权利要求71-83之一的复合物,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶包含核定位信号NLS。85.权利要求71-43之一的复合物,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶是dCas9。86.权利要求71-85之一的复合物,其中所述靶多核苷酸序列是基因的部分。87.权利要求71-85之一的复合物,其中所述靶多核苷酸序列是转录调控序列的部分。88.权利要求71-85或87之一的复合物,其中所述靶多核苷酸序列是启动子、增强子或沉默子的部分。89.权利要求71-88之一的复合物,其中所述靶多核苷酸序列是高甲基化核酸序列。90.权利要求71-89之一的复合物,其中所述靶多核苷酸序列是高甲基化的CpG序列。91.权利要求71-85或87-90之一的复合物,其中所述靶多核苷酸序列是hMLH1启动子的部分。92.权利要求71-86或89-90之一的复合物,其中所述靶多核苷酸序列是Sox基因的部分。93.权利要求71-92之一的复合物,其中所述第一或所述第二PBS序列包含8个核苷酸的长度。94.权利要求71-93之一的复合物,其中所述第一或所述第二PBS序列包含SEQIDNO:1的核苷酸序列。95.权利要求71-94之一的复合物,其中所述第一或所述第二PUF结构域包含PUFa结构域、PUFb结构域、PUFc结构域或PUFw结构域。96.权利要求95的复合物,其中所述第一或所述第二PUFa结构域具有SEQIDNO:2的氨基酸序列。97.权利要求95的复合物,其中所述第一或所述第二PUFb结构域具有SEQIDNO:3的氨基酸序列。98.权利要求95的复合物,其中所述第一或所述第二PUFc结构域具有SEQIDNO:4的氨基酸序列。99.如权利要求95所述的复合物,其中所述第一或所述第二PUFw结构域具有SEQIDNO:5的氨基酸序列。100.一种使哺乳动物细胞中的靶核酸序列去甲基化的方法,包括:a提供含有需要去甲基化的靶核酸的哺乳动物细胞;b向所述哺乳动物细胞递送编码核酸酶缺陷的RNA指导DNA核酸内切酶的第一多核苷酸;c向所述哺乳动物细胞递送第二多核苷酸,该第二多核苷酸包含:i与靶多核苷酸序列互补的DNA靶向序列;ii所述核酸酶缺陷型RNA指导DNA核酸内切酶的结合序列;iii第一PUF结合位点PBS序列,和iv第二PUF结合位点PBS序列,其中所述核酸酶缺陷的RNA指导DNA核酸内切酶通过所述结合序列与所述第二多核苷酸结合;d向所述哺乳动物细胞递送编码去甲基化蛋白缀合物的第三多核苷酸,该去甲基化蛋白缀合物包含:i第一PUF结构域;和ii去甲基化结构域,所述去甲基化结构域可操作地连接到所述第一PUF结构域的C-末端,和e向所述哺乳动物细胞递送编码去甲基化增强子缀合物的第四多核苷酸,该去甲基化增强子缀合物包含:i第二PUF结构域;和ii与所述第二PUF结构域可操作地连接的去甲基化增强子结构域,其中所述递送的去甲基化蛋白缀合物使所述细胞中的所述靶核酸序列去甲基化。101.权利要求100的方法,其中所述去甲基化蛋白缀合物通过所述第一PUF结构域结合所述第一PBS序列而与所述核糖核蛋白复合物结合。102.权利要求100或101的方法,其中所述去甲基化增强子缀合物通过所述第二PUF结构域结合所述第二PBS序列而与所述核糖核蛋白复合物结合。103.权利要求100-102之一的方法,其中所述去甲基化增强子结构域与所述第二PUF结构域的N-末端可操作地连接。104.权利要求100-102之一的方法,其中所述去甲基化增强子结构域与所述第二PUF结构域的C-末端可操作地连接。105.权利要求100-104之一的方法,其中所述第一多核苷酸包含在第一载体内。106.权利要求100-105之一的方法,其中所述第二多核苷酸包含在第二载体内。107.权利要求100-106之一的方法,其中所述第三多核苷酸包含在第三载体内。108.权利要求100-107之一的方法,其中所述第四多核苷酸包含在第四载体内。109.权利要求100-108之一的方法,其中所述第一、第二、第三或第四载体是相同的。110.权利要求100-109之一的方法,其中所述递送通过转染进行。111.一种试剂盒,包括:i权利要求71-99之一的核糖核蛋白复合物或编码它的核酸;ii权利要求71-99之一的去甲基化蛋白缀合物或编码它的核酸,和iii权利要求71-99之一的去甲基化增强子缀合物或编码它的核酸。112.权利要求111的试剂盒,还包括转染剂。113.如权利要求111或112所述的试剂盒,还包括用于从癌症患者收集样品的样品收集装置。

百度查询: 杰克逊实验室 靶向增强的DNA去甲基化

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。