碱基编辑酶的制作方法
- 国知局
- 2024-06-20 11:05:56
背景技术:
1、cas酶以及其相关的成簇的规则间隔的短回文重复序列(crispr)向导核糖核酸(rna)似乎是原核免疫系统的普遍组分(约45%的细菌,约84%的古细菌),用于通过crispr-rna引导的核酸切割来保护此类微生物免受非自身核酸的侵害,如传染性病毒和质粒。虽然编码crispr rna元件的脱氧核糖核酸(dna)元件在结构和长度上可能相对保守,但其crispr相关(cas)蛋白是高度多样化的,含有多种核酸相互作用结构域。虽然早在1987年就观察到crispr dna元件,但crispr复合物的可编程核酸内切酶切割能力直到最近才被认识到,从而引起重组crispr系统在各种dna操纵和基因编辑应用中的使用。
2、序列表
3、本技术含有已经以xml格式电子提交的序列表,并且特此以其整体并入。创建于2022年11月4日的所述xml副本命名为55921-742_601_sl.xml,并且大小为2,274,288kb。
技术实现思路
1、在一些方面,本公开提供了一种使细胞中的真核核酸序列中的胞嘧啶残基脱氨基的方法,所述方法包括:使具有胞嘧啶脱氨酶活性的多肽与所述真核核酸序列接触,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述真核核酸序列是哺乳动物、灵长类动物或人核酸序列。在一些实施例中,所述细胞是哺乳动物细胞、灵长类动物细胞或人细胞。在一些实施例中,所述真核核酸序列包括单链dna(ssdna)或核糖核酸(rna)。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:809-811、819、826、752、777、823、668-671、675、650、752、774、777、806、812、816、817、818、825、827、832、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括与seqid no:808、810-811、819、826、752、777或823中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述真核核酸序列包括双链dna(dsdna)。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:810-811中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括核酸结合结构域、核酸内切酶或切口酶。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括所述核酸内切酶或所述切口酶,其中所述核酸内切酶或所述切口酶包括与seq id no:70-78、596、597、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括切口酶,其中所述切口酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq idno:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括尿嘧啶dna糖基化酶抑制剂序列。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seq id no:67中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括fam72a序列。在一些实施例中,所述fam72a序列与seq id no:1121或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
2、在一些方面,本公开提供了一种使细胞中的灵长类动物核酸序列中的胞嘧啶残基脱氨基的方法,所述方法包括:使具有胞嘧啶脱氨酶活性的多肽与灵长类动物核酸序列接触,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:599-638、660-675、828-835中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述真核核酸序列包括双链dna(dsdna)、单链dna(ssdna)或核糖核酸(rna)。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括核酸结合结构域、核酸内切酶或切口酶。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括所述核酸内切酶或所述切口酶,其中所述核酸内切酶或所述切口酶包括与seq id no:70-78、596、597、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括切口酶,其中所述切口酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq idno:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括尿嘧啶dna糖基化酶抑制剂序列。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seq id no:67中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括fam72a序列。在一些实施例中,所述fam72a序列与seq id no:1121或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
3、在一些方面,本公开提供了一种核酸,其包括经工程化的核酸序列,所述经工程化的核酸序列被优化以在哺乳动物生物体中表达,其中所述核酸编码与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述核酸编码与seq id no:809-811、819、826、752、777、823、668-671、675、650、752、774、777、806、812、816、817、818、825、827、832、832、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
4、在一些方面,本公开提供了一种核酸,其编码本文所描述的多肽中的任何多肽。
5、在一些方面,本公开提供了一种载体,其包括本文所描述的核酸中的任何核酸。
6、在一些方面,本公开提供了一种融合多肽,其包括:(a)具有胞嘧啶脱氨酶活性的结构域,所述具有胞嘧啶脱氨酶活性的结构域包括与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列;以及(b)核酸结合结构域、核酸内切酶结构域或切口酶结构域。在一些实施例中,所述具有胞嘧啶脱氨酶活性的结构域包括与seq id no:809-811、819、826、752、777、823、668-671、675、650、752、774、777、806、812、816、817、818、825、827、832、832、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的结构域包括与seq id no:809-811、819、826、752、777、823中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述融合多肽包括所述核酸内切酶结构域或所述切口酶结构域,其中所述核酸内切酶结构域或所述切口酶结构域包括与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述融合蛋白包括所述切口酶结构域,其中所述切口酶结构域包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。在一些实施例中,所述融合蛋白包括与seq id no:877-916或968-969中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
7、在一些方面,本公开提供了一种系统,其包括:(a)融合蛋白中的任何融合蛋白(例如,核酸内切酶-碱基编辑器或核酸内切酶-脱氨酶融合体);以及(b)经工程化的向导多核苷酸,所述经工程化的向导多核苷酸被配置成与所述核酸内切酶结构域形成复合物,所述经工程化的向导多核苷酸包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结构域结合。在一些实施例中,所述经工程化的向导多核苷酸进一步包括与seqid no:88-96、917-931、963-967、1099-1105中的任一者的非简并核苷酸或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
8、在一些方面,本公开提供了一种多肽,其具有腺苷脱氨酶活性,所述多肽包括:与seq id no:50、51、385-443、448-475中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列,其中当最佳比对时,所述多肽包括相对于seq id no:50的以下残基中的至少一个残基或其任何组合的取代:t2、d7、e10、m13、w24、g32、k38、g45、g51、a63、e66、r75、c91、g93、h97、a107、e108、d109、p110、h124、a126、h129、f150或s165。在一些实施例中,当最佳比对时,所述取代包括相对于seq id no:50或mg68-4的t2x1、d7x1、e10x1、m13x4、w24x1、g32x1、k38x2、g45x2、g51x5、a63x7、e66x5、e66x2、r75h、c91r、g93x6、h97x6、h97x5、a107x5、e108x2、d109n、p110h、h124x6、a126x2、h129r、h129n、f150p、f150s、s165x5或其任何组合,其中x1是a或g;x2是d或e;x3是n或q;x4是r或k;x5是i、l、m或v;x6是f、y或w;以及x7是s或t。在一些实施例中,所述多肽包括与seq id no:836-860中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述多肽包括seq idno:839、841、843、844、847、848、849、850、851、852、859中的任一者或其变体。在一些实施例中,当最佳比对时,所述取代包括相对于seq id no:50或mg68-4的w24g、g51v、e108d、p110h、f150p、d7g、e10g或h129n或其任何组合。在一些实施例中,所述多肽进一步包括核酸结合结构域、核酸内切酶结构域或切口酶结构域。在一些实施例中,所述多肽包括所述核酸内切酶结构域或所述切口酶结构域,其中所述核酸内切酶结构域或所述切口酶结构域包括与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述多肽包括所述切口酶结构域,其中所述切口酶结构域包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq idno:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。
9、在一些方面,本公开提供了一种系统,其包括:(a)本文所描述的多肽或融合多肽中的任何多肽或融合多肽;以及(b)经工程化的向导多核苷酸,所述经工程化的向导多核苷酸被配置成与所述核酸内切酶结构域形成复合物,所述经工程化的向导多核苷酸包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结构域结合。在一些实施例中,所述经工程化的向导多核苷酸进一步包括与seq id no:88-96、917-931、963-967、1099-1105中的任一者的非简并核苷酸或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列;
10、在一些方面,本公开提供了一种使细胞中的胞嘧啶残基脱氨基的方法,所述方法包括向所述细胞中引入:(a)编码具有胞嘧啶脱氨酶活性的多肽的载体;以及(b)编码fam72a蛋白的载体。在一些实施例中,编码所述fam72a蛋白的所述载体包括与seq id no:1115或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列,或者编码与seqid no:1121或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括核酸结合结构域、核酸内切酶结构域或切口酶结构域。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括所述核酸内切酶结构域或所述切口酶结构域,其中所述核酸内切酶结构域或所述切口酶结构域包括与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括所述切口酶结构域,其中所述切口酶结构域包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。
11、在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括(i)具有胞嘧啶脱氨酶活性的序列;以及(ii)源自fam72a蛋白的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的序列与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,源自所述fam72a蛋白的所述序列与seq id no:1121或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述多肽进一步包括包含ruvc结构域和hnh结构域的核酸内切酶序列,其中所述核酸内切酶序列是2类ii型核酸内切酶的序列。在一些实施例中,所述ruvc结构域缺乏核酸酶活性。在一些实施例中,所述核酸内切酶包括切口酶。在一些实施例中,所述2类ii型核酸内切酶序列与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,当最佳比对时,所述2类ii型核酸内切酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10。
12、在一些方面,本公开提供了一种将细胞中的胞嘧啶残基编辑为胸腺嘧啶残基的方法,所述方法包括使本文所描述的胞嘧啶脱氨酶融合多肽中的任何胞嘧啶脱氨酶融合多肽与所述细胞接触。在一些实施例中,所述细胞是原核细胞、真核细胞、哺乳动物细胞、灵长类动物细胞或人细胞。
13、在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括:源自2类ii型核酸内切酶的多个结构域,其中所述结构域包括ruvc-i结构域、rec结构域、hnh结构域、ruvc-iii结构域和wed结构域;以及包括碱基编辑器序列的结构域,其中所述碱基器编辑序列插入到以下:(a)所述碱基编辑器序列插入在所述ruvc-i结构域内;(b)所述碱基编辑器序列插入在所述rec结构域内;(c)所述碱基编辑器序列插入在所述hnh结构域内;(d)所述碱基编辑器序列插入在所述ruv-ciii结构域内;(e)所述碱基编辑器序列插入在所述wed结构域内;(f)所述碱基编辑器序列在所述hnh结构域之前插入;(g)所述碱基编辑器序列在所述ruv-ciii结构域之前插入;或(h)所述碱基编辑器序列插入在所述ruvc-iii结构域与所述wed结构域之间。在一些实施例中,所述2类ii型核酸内切酶包括与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述2类ii型核酸内切酶包括与seq id no:1647或其变体具有至少80%序列同一性的序列。在一些实施例中,所述碱基编辑器序列包括脱氨酶序列。在一些实施例中,所述脱氨酶序列与seq id no:1-49、444-447、599-675、744-835、970-982、50、51、385-443、448-475中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述脱氨酶序列与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述脱氨酶序列与seq id no:50、51、385-443、448-475中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述脱氨酶与seqid no:386或其变体具有至少80%序列同一性。在一些实施例中,当最佳比对时,所述脱氨酶序列包括相对于seq id no:50或mg68-4的以下残基中的一个残基或其任何组合的取代:t2、d7、e10、m13、w24、g32、k38、g45、g51、a63、e66、r75、c91、g93、h97、a107、e108、d109、p110、h124、a126、h129、f150或s165。在一些实施例中,所述经工程化的核酸编辑多肽包括与seq id no:1128-1160中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述经工程化的核酸编辑多肽包括与seq id no:1137、1140、1142、1143、1146、1149、1151-1158中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述经工程化的核酸编辑多肽包括与seqid no:1139、1152、1158中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
14、在一些方面,本公开提供了多肽,其具有腺苷脱氨酶活性,所述多肽包括:与seqid no:50、51、385-443、448-475中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列,其中当最佳比对时,所述多肽包括相对于seq id no:386的野生型残基对残基109处的非野生型残基的取代和包括以下中的任一者或其任何组合的一个其它残基:24、37、49、52、83、85、107、110、112、120、123、124、147、148、150、156、157、158、166、167或129。在一些实施例中,所述序列与seq id no:386具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,当最佳比对时,所述多肽包括相对于seq id no:386的109n的取代和包括以下中的任一者或其任何组合的至少一个其它取代:24r、37l、49a、52l、83s、85f、107v、110s、112r、120n、123n、124y、147c、148y、148r、150y、156v、157f、158n、166i或129n。在一些实施例中,肽包括图34b中描绘的取代中的任何取代。在一些实施例中,所述多肽与seq id no:1161-1183中的任一者或其变体具有至少80%序列同一性。在一些实施例中,所述多肽与seq id no:1170、1179或1166中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述多肽进一步包括核酸内切酶或切口酶。在一些实施例中,所述多肽包括所述核酸内切酶或所述切口酶,其中所述核酸内切酶或所述切口酶包括与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述多肽包括所述切口酶,其中所述切口酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seqid no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。
15、在一些方面,本公开提供了一种多肽,其具有胞嘧啶脱氨酶活性,所述多肽包括:与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列;其中所述多肽包括表12c中描述的改变中的至少一个改变。在一些实施例中,任选地相对于apobec多肽,所述多肽具有野生型氨基酸对包括以下中的任一者或其任何组合的非野生型氨基酸的至少一个取代:w90a、w90f、w90h、w90y、y120f、y120h、y121f、y121h、y121q、y121a、y121d、y121w、h122y、h122f、h122i、h122a、h122w、h122d、y121t、r33a、r34a、r34k、h122a、r33a、r34a、r52a、n57g、h122a、e123a、e123q、w127f、w127h、w127q、w127a、w127d、r39a、k40a、h128a、n63g、r58a、h121f、h121y、h121q、h121a、h121d、h121w、r33a、k34a、h122a、h121a、r52a、p26r、p26a、n27r、n27a、w44a、w45a、k49g、s50g、r51g、r121a、i122a、n123a、y88f、y120f、p22r、p22a、k23a、k41r、k41a、e54a、e54a、e55a、k30a、k30r、m32a、m32k、y117a、k118a、i119a、i119h、r120a、r121a、p46a、p46r、n29a、r27a或n50g。在一些实施例中,所述多肽包括与seq id no:1208-1315中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
16、在一些方面,本公开提供了一种多肽,其具有胞嘧啶脱氨酶活性,所述多肽包括:胞嘧啶脱氨酶序列,所述胞嘧啶脱氨酶序列与seq id no:835、1275、668、774、818、671、667、650、827、819、823、814、813、817、628、826、1223、834、618、621、669、833、830中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;以及核酸内切酶或切口酶。在一些实施例中,所述核酸内切酶或所述切口酶包括与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%同一性的序列。在一些实施例中,所述多肽包括所述切口酶,其中所述切口酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq idno:597的残基10或其任何组合。在一些实施例中,所述胞嘧啶脱氨酶序列与seq id no:1275、835或774中的任一者或其组合具有至少80%序列同一性。
17、在一些方面,本公开提供了一种多肽,其具有腺苷脱氨酶活性,所述多肽包括:与seq id no:50、51、385-443、448-475、1015-1098中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列,其中所述多肽包括表12d中列举的野生型残基对非野生型残基的取代的任何组合。在一些实施例中,所述多肽与seq id no:1556-1638中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述多肽进一步包括核酸内切酶或切口酶。在一些实施例中,所述多肽包括所述核酸内切酶或所述切口酶,其中所述核酸内切酶或所述切口酶包括与seq id no:70-78、596、597-598、1120或1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述多肽包括所述切口酶,其中所述切口酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。
18、在一些方面,本公开提供了一种多肽,其具有腺苷脱氨酶活性,所述多肽包括:与seq id no:50、51、385-443、448-475、1015-1098中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列,其中所述多肽包括表13中列举的野生型残基对非野生型残基的取代的任何组合。在一些实施例中,所述序列与seq id no:386或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述多肽进一步包括核酸内切酶或切口酶。在一些实施例中,所述多肽包括所述核酸内切酶或所述切口酶,其中所述核酸内切酶或所述切口酶包括与seq id no:70-78、596、597-598、1120或1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述多肽包括所述切口酶,其中所述切口酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq idno:597的残基10或其任何组合。
19、在一些方面,本公开提供了一种编辑细胞中的apoa1基因座的方法,所述方法包括使以下与所述细胞接触:(a)rna引导的核酸内切酶;以及(b)经工程化的向导核酸结构,其中所述经工程化的向导核酸结构被配置成与所述核酸内切酶形成复合物,并且所述经工程化的向导核酸结构包括间隔子序列,所述间隔子序列被配置成与所述apoa1基因座的区杂交,其中所述经工程化的向导核酸结构包括与seq id no:1455-1478中的任一者的至少18个、19个、20个、21个、22个、23个、24个、25个或26个连续核苷酸或其反向补体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的靶向序列。在一些实施例中,所述经工程化的向导核酸结构与seq id no:1431-1454中的任一者具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述经工程化的向导核酸结构包括表13a中列举的核苷酸修饰中的任何核苷酸修饰。在一些实施例中,所述rna引导的核酸内切酶是2类ii型核酸内切酶。在一些实施例中,所述rna引导的核酸内切酶与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
20、在一些方面,本公开提供了一种编辑细胞中的angptl3基因座的方法,所述方法包括使以下与所述细胞接触:(a)rna引导的核酸内切酶;以及(b)经工程化的向导核酸结构,其中所述经工程化的向导核酸结构被配置成与所述核酸内切酶形成复合物,并且所述经工程化的向导核酸结构包括间隔子序列,所述间隔子序列被配置成与所述angptl3基因座的区杂交,其中所述经工程化的向导核酸结构包括与seq id no:1484-1488中的任一者的至少18个、19个、20个、21个、22个、23个、24个、25个或26个连续核苷酸或其反向补体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的靶向序列。在一些实施例中,所述经工程化的向导核酸结构与seq id no:1479-1483中的任一者具有至少80%同一性。在一些实施例中,所述经工程化的向导核酸结构包括表13a中列举的核苷酸修饰中的任何核苷酸修饰。在一些实施例中,所述rna引导的核酸内切酶是2类ii型核酸内切酶。在一些实施例中,所述rna引导的核酸内切酶与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
21、在一些方面,本公开提供了一种编辑细胞中的trac基因座的方法,所述方法包括使以下与所述细胞接触:(a)rna引导的核酸内切酶;以及(b)经工程化的向导核酸结构,其中所述经工程化的向导核酸结构被配置成与所述核酸内切酶形成复合物,并且所述经工程化的向导核酸结构包括间隔子序列,所述间隔子序列被配置成与所述trac基因座的区杂交,其中所述经工程化的向导核酸结构包括与seq id no:1491-1492中的任一者的至少18个、19个、20个、21个、22个、23个、24个、25个或26个连续核苷酸或其反向补体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的靶向序列。在一些实施例中,所述经工程化的向导核酸结构与seq id no:1489-1490中的任一者具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,所述经工程化的向导核酸结构包括表13a中列举的核苷酸修饰中的任何核苷酸修饰。在一些实施例中,所述rna引导的核酸内切酶是2类ii型核酸内切酶。在一些实施例中,所述rna引导的核酸内切酶与seq id no:70-78、596、597-598、1120、1122-1127、1647中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
22、在一些方面,本公开提供了一种经工程化的腺苷碱基编辑器多肽,其中所述多肽包括与seq id no:1647-1653中的任一者具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
23、在一些方面,本公开提供了一种使细胞中的真核核酸序列中的胞嘧啶残基脱氨基的方法,所述方法包括:使具有胞嘧啶脱氨酶活性的多肽与所述真核核酸序列接触,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述真核核酸序列是哺乳动物、灵长类动物或人核酸序列。在一些实施例中,所述细胞是哺乳动物细胞、灵长类动物细胞或人细胞。在一些实施例中,所述真核核酸序列包括单链dna(ssdna)或核糖核酸(rna)。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:809-811、819、826、752、777、823、668-671、675、650、752、774、777、806、812、816、817、818、825、827、832、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:808、810-811、819、826、752、777或823中的任一者或其变体具有至少80%同一性的序列。在一些实施例中,所述真核核酸序列包括双链dna(dsdna)。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:810-811中的任一者具有至少80%同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括核酸结合结构域、核酸内切酶或切口酶。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括所述核酸内切酶或所述切口酶,其中所述核酸内切酶或所述切口酶包括与seq id no:70-78、596、597、1120或1122-1127中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括切口酶,其中所述切口酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括尿嘧啶dna糖基化酶抑制剂序列。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seq id no:67中的任一者或其变体具有至少70%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括fam72a序列。在一些实施例中,所述fam72a序列与seq id no:1121或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
24、在一些方面,本公开提供了一种使细胞中的灵长类动物核酸序列中的胞嘧啶残基脱氨基的方法,所述方法包括:使具有胞嘧啶脱氨酶活性的多肽与所述灵长类动物核酸序列接触,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:599-638、660-675或828-835中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述真核核酸序列包括双链dna(dsdna)、单链dna(ssdna)或核糖核酸(rna)。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括核酸结合结构域、核酸内切酶或切口酶。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括所述核酸内切酶或所述切口酶,其中所述核酸内切酶或所述切口酶包括与seq id no:70-78、596、597、1120或1122-1127中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括切口酶,其中所述切口酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括尿嘧啶dna糖基化酶抑制剂序列。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seq idno:67中的任一者或其变体具有至少70%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括fam72a序列。在一些实施例中,所述fam72a序列与seq id no:1121或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
25、在一些方面,本公开提供了一种核酸,其包括经工程化的核酸序列,所述经工程化的核酸序列被优化以在哺乳动物生物体中表达,其中所述核酸编码与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少70%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述核酸编码与seq id no:809-811、819、826、752、777、823、668-671、675、650、752、774、777、806、812、816、817、818、825、827、832、832、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
26、在一些方面,本公开提供了一种载体,其包括本文所描述的核酸中的任何核酸。在一些实施例中,所述载体是非病毒或病毒载体。在一些实施例中,所述载体是质粒、微环或质粒载体。在一些实施例中,所述病毒载体是aav载体。
27、在一些方面,本公开提供了一种融合多肽,其包括:(a)具有胞嘧啶脱氨酶活性的结构域,所述具有胞嘧啶脱氨酶活性的结构域包括与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%同一性的序列;以及(b)核酸结合结构域、核酸内切酶结构域或切口酶结构域。在一些实施例中,所述具有胞嘧啶脱氨酶活性的结构域包括与seq id no:809-811、819、826、752、777、823、668-671、675、650、752、774、777、806、812、816、817、818、825、827、832、832、970-982中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的结构域包括与seq id no:809-811、819、826、752、777、823中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述融合多肽包括所述核酸内切酶结构域或所述切口酶结构域,其中所述核酸内切酶结构域或所述切口酶结构域包括与seq id no:70-78、596、597-598、1120或1122-1127中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述融合蛋白包括所述切口酶结构域,其中所述切口酶结构域包括在以下处天冬氨酸变为丙氨酸的突变:相对于seqid no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。在一些实施例中,所述融合蛋白包括与seq id no:877-916或968-969中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
28、在一些方面,本公开提供了一种系统,其包括:(a)本文所描述的融合多肽中的任何融合多肽;以及(b)经工程化的向导多核苷酸,所述经工程化的向导多核苷酸被配置成与所述核酸内切酶结构域形成复合物,所述经工程化的向导多核苷酸包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结构域结合。在一些实施例中,所述经工程化的向导多核苷酸进一步包括与seq id no:88-96、917-931、963-967或1099-1105中的任一者的非简并核苷酸或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
29、在一些方面,本公开提供了一种多肽,其具有腺苷脱氨酶活性,所述多肽包括:与seq id no:50、51、385-443、448-475中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列,其中当最佳比对时,所述多肽包括相对于seq id no:50的以下残基中的至少一个残基或其任何组合的取代:t2、d7、e10、m13、w24、g32、k38、g45、g51、a63、e66、r75、c91、g93、h97、a107、e108、d109、p110、h124、a126、h129、f150或s165。在一些实施例中,当最佳比对时,所述取代包括相对于seq id no:50的t2x1、d7x1、e10x1、m13x4、w24x1、g32x1、k38x2、g45x2、g51x5、a63x7、e66x5、e66x2、r75h、c91r、g93x6、h97x6、h97x5、a107x5、e108x2、d109n、p110h、h124x6、a126x2、h129r、h129n、f150p、f150s、s165x5或其任何组合,其中x1是a或g;x2是d或e;x3是n或q;x4是r或k;x5是i、l、m或v;x6是f、y或w;以及x7是s或t。在一些实施例中,所述多肽包括与seq id no:836-860中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述多肽包括seq id no:839、841、843、844、847、848、849、850、851、852或859中的任一者。在一些实施例中,当最佳比对时,所述取代包括相对于seq id no:50的w24g、g51v、e108d、p110h、f150p、d7g、e10g或h129n或其任何组合。在一些实施例中,所述多肽进一步包括核酸结合结构域、核酸内切酶结构域或切口酶结构域。在一些实施例中,所述多肽包括所述核酸内切酶结构域或所述切口酶结构域,其中所述核酸内切酶结构域或所述切口酶结构域包括与seq id no:70-78、596、597-598、1120或1122-1127中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。在一些实施例中,所述多肽包括所述切口酶结构域,其中所述切口酶结构域包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq idno:76的残基23或相对于seq id no:597的残基10或其任何组合。
30、在一些方面,本公开提供了一种系统,其包括:(a)用于本文所描述的碱基编辑器融合体的多肽中的任何多肽(例如,核酸内切酶脱氨酶融合体);以及(b)经工程化的向导多核苷酸,所述经工程化的向导多核苷酸被配置成与所述核酸内切酶结构域形成复合物,所述经工程化的向导多核苷酸包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结构域结合。在一些实施例中,所述经工程化的向导多核苷酸进一步包括与seqid no:88-96、917-931、963-967或1099-1105中的任一者的非简并核苷酸具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的序列。
31、在一些方面,本公开提供了一种使细胞中的胞嘧啶残基脱氨基的方法,所述方法包括向所述细胞中引入:(a)编码具有胞嘧啶脱氨酶活性的多肽的载体;以及(b)编码fam72a蛋白的载体。在一些实施例中,编码所述fam72a蛋白的所述载体包括与seq id no:1115具有至少80%同一性的序列,或者编码与seq id no:1121具有至少80%同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括与seq id no:1-49、444-447、599-675、744-835、970-982中的任一者或其变体具有至少80%同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽进一步包括核酸结合结构域、核酸内切酶结构域或切口酶结构域。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括所述核酸内切酶结构域或所述切口酶结构域,其中所述核酸内切酶结构域或所述切口酶结构域包括与seq id no:70-78、596、597-598、1120或1122-1127中的任一者或其变体具有至少80%同一性的序列。在一些实施例中,所述具有胞嘧啶脱氨酶活性的多肽包括所述切口酶结构域,其中所述切口酶结构域包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq idno:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10或其任何组合。
32、在一些方面,本公开提供了一种经工程化的核酸编辑系统,其包括:核酸内切酶,所述核酸内切酶包括ruvc结构域和hnh结构域,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型核酸内切酶,其中所述核酸内切酶被配置成缺乏核酸酶活性;碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联,以及经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述经工程化的向导核糖核酸结构包括:向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述ruvc结构域缺乏核酸酶活性。在一些实施例中,所述2类ii型核酸内切酶包括切口酶突变。在一些实施例中,当最佳比对时,所述2类ii型核酸内切酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10。在一些实施例中,当最佳比对时,所述核酸内切酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:72的残基13或相对于seq id no:75的残基17。在一些实施例中,所述核酸内切酶包括与seq id no:70-78或597中的任一者或其变体具有至少95%序列同一性的序列。在一些方面,本公开提供了一种经工程化的核酸编辑系统,其包括:核酸内切酶,所述核酸内切酶与seq id no:70-78或597中的任一者或其变体具有至少95%序列同一性;碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联,以及经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述经工程化的向导核糖核酸结构包括:向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结合。在一些方面,本公开提供了一种经工程化的核酸编辑系统,其包括:核酸内切酶,所述核酸内切酶被配置成与包括seq id no:360-368或598中的任一者或其变体的原间隔子相邻基序(pam)序列结合,其中所述核酸内切酶是2类ii型核酸内切酶,并且其中所述核酸内切酶被配置成缺乏核酸酶活性;碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联,以及经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述经工程化的向导核糖核酸结构包括:向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述核酸内切酶包括切口酶突变。在一些实施例中,所述核酸内切酶被配置成切割双链靶脱氧核糖核酸的一条链。在一些实施例中,当最佳比对时,所述2类ii型核酸内切酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10。在一些实施例中,所述碱基编辑器包括与seq id no:1-51、57-66、385-443、444-475、594-595或599-675中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述碱基编辑器包括与seq id no:50-51或385-390中的任一者具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述ruvc结构域缺乏核酸酶活性。在一些实施例中,所述核酸内切酶源自未培养的微生物。在一些实施例中,所述核酸内切酶与cas9核酸内切酶具有小于80%同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述经工程化的向导核糖核酸序列包括与seq idno:88-96、488-489或679-680中的任一者的非简并核苷酸或其变体具有至少80%序列同一性的序列。在一些方面,本公开提供了一种经工程化的核酸编辑系统,其包括:经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构包括:向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及核糖核酸序列,所述核糖核酸序列被配置成与核酸内切酶结合,其中所述经工程化的核糖核酸序列包括与seq id no:88-96、488-489或679-680中的任一者的非简并核苷酸或其变体具有至少80%序列同一性的序列;2类ii型核酸内切酶,所述2类ii型核酸内切酶被配置成与所述经工程化的向导核糖核酸结合;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联。在一些实施例中,所述碱基编辑器包括与seq id no:50-51或385-390中的任一者具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述核酸内切酶被配置成与选自由seq id no:360-368或598组成的组的原间隔子相邻基序(pam)序列结合。在一些实施例中,所述碱基编辑器包括与seq id no:1-51、57-66、385-443、444-475、594-595或599-675中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述碱基编辑器是腺嘌呤脱氨酶。在一些实施例中,所述腺苷脱氨酶包括与seq id no:50-51、57、385-443、448-475或595中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述碱基编辑器是胞嘧啶脱氨酶。在一些实施例中,所述胞嘧啶脱氨酶包括与seq idno:1-49、444-447、594或58-66中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述系统进一步包括与所述核酸内切酶或所述碱基编辑器偶联的尿嘧啶dna糖基化酶抑制剂。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seq id no:67中的任一者具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述经工程化的向导核糖核酸结构包括至少两个核糖核酸多核苷酸。在一些实施例中,所述经工程化的向导核糖核酸结构包括一个核糖核酸多核苷酸,所述核糖核酸多核苷酸包括所述向导核糖核酸序列和所述tracr核糖核酸序列。在一些实施例中,所述向导核糖核酸序列与原核、细菌、古细菌、真核、真菌、植物、哺乳动物或人基因组序列互补。在一些实施例中,所述向导核糖核酸序列的长度是15-24个核苷酸。在一些实施例中,所述核酸内切酶包括接近所述核酸内切酶的n末端或c末端的一个或多个核定位序列(nls)。在一些实施例中,所述nls包括与选自seq id no:369-384或其变体具有至少90%同一性的序列。在一些实施例中,所述核酸内切酶与所述碱基编辑器直接共价偶联或通过接头与所述碱基编辑器共价偶联。在一些实施例中,当最佳比对时,所述核酸内切酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73或78的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23、相对于seq id no:77的残基8或相对于seq id no:597的残基10。在一些实施例中,当最佳比对时,所述核酸内切酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:72的残基13或相对于seq id no:75的残基17。在一些实施例中,多肽包括所述核酸内切酶和所述碱基编辑器。在一些实施例中,所述核酸内切酶被配置成切割双链靶脱氧核糖核酸的一条链。在一些实施例中,所述系统进一步包括mg2+的来源。在一些实施例中:(a)所述核酸内切酶包括与seq id no:70、71、73、74、76、78、77或78中的任一者或其变体至少70%、至少80%或至少90%相同的序列;(b)所述向导rna结构包括与seq id no:88、89、91、92、94、96、95或488中的任一者的非简并核苷酸至少70%、至少80%或至少90%相同的序列;(c)所述核酸内切酶被配置成与包括seq idno:360、361、363、365、367或368中的任一者的pam结合;或(d)所述碱基编辑器包括与seqid no:58或595或其变体至少70%、至少80%或至少90%相同的序列。在一些实施例中:(a)所述核酸内切酶包括与seq id no:70、71或78中的任一者或其变体至少70%、至少80%或至少90%相同的序列;(b)所述向导rna结构包括与seq id no:88、89或96中的至少一者的非简并核苷酸至少70%、至少80%或至少90%相同的序列;(c)所述核酸内切酶被配置成与包括seq id no:360、362或368中的任一者的pam结合;或所述碱基编辑器包括与seq idno:594或其变体至少70%、至少80%或至少90%相同的序列。在一些实施例中,所述序列同一性是通过blastp、clustalw、muscle、mafft或史密斯-沃特曼同源性搜索算法(smith-waterman homology search algorithm)来确定的。在一些实施例中,所述序列同一性是通过使用字长(w)为3、期望值(e)为10的参数以及blosum62评分矩阵(将空位罚分设置为存在11,扩展1)并且使用条件组成评分矩阵调整的所述blastp同源性搜索算法来确定的。在一些实施例中,所述核酸内切酶被配置成催化死亡。在一些实施例中,所述核酸内切酶被配置成切割双链靶脱氧核糖核酸的一条链。
33、在一些方面,本公开提供了一种核酸,其包括经工程化的核酸序列,所述经工程化的核酸序列被优化以在生物体中表达,其中所述核酸编码与碱基编辑器偶联的2类ii型核酸内切酶,并且其中所述核酸内切酶源自未培养的微生物。
34、在一些方面,本公开提供了一种核酸,其包括经工程化的核酸序列,所述经工程化的核酸序列被优化以在生物体中表达,其中所述核酸编码与偶联到碱基编辑器的seq idno:70-78中的任一者具有至少70%序列同一性的核酸内切酶。在一些实施例中,所述核酸内切酶包括编码接近所述核酸内切酶的n末端或c末端的一个或多个核定位序列(nls)的序列。在一些实施例中,所述nls包括与选自seq id no:369-384或其变体具有至少90%同一性的序列。在一些实施例中,所述生物体是原核生物、细菌、真核生物、真菌、植物、哺乳动物、啮齿动物或人。
35、在一些方面,本公开提供了一种载体,其包括核酸序列,所述核酸序列编码与碱基编辑器偶联的2类ii型核酸内切酶,其中所述核酸内切酶源自未培养的微生物。
36、在一些方面,本公开提供了一种载体,其包括本文所描述的各方面或实施例中的任何方面或实施例的核酸。在一些实施例中,所述载体进一步包括编码经工程化的向导核糖核酸结构的核酸,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述经工程化的向导核糖核酸结构包括:向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述载体是质粒、微环、celid、腺相关病毒(aav)源性病毒体或慢病毒。
37、在一些方面,本公开提供了一种细胞,其包括本文所描述的各方面或实施例中的任何方面或实施例的载体。
38、在一些方面,本公开提供了一种制备核酸内切酶的方法,所述方法包括培养本文所描述的各方面或实施例中的任何方面或实施例的细胞。
39、在一些方面,本公开提供了一种用于修饰双链脱氧核糖核酸多核苷酸的方法,所述方法包括使所述双链脱氧核糖核酸多核苷酸与复合物接触,所述复合物包括:核酸内切酶,所述核酸内切酶包括ruvc结构域和hnh结构域,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型核酸内切酶,并且其中所述核酸内切酶被配置成缺乏核酸酶活性;碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联;以及经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶和所述双链脱氧核糖核酸多核苷酸结合;其中所述双链脱氧核糖核酸多核苷酸包括原间隔子相邻基序(pam)。在一些实施例中,包括ruvc结构域和hnh结构域的所述核酸内切酶与所述碱基编辑器直接共价偶联或通过接头与所述碱基编辑器共价偶联。在一些实施例中,包括ruvc结构域和hnh结构域的所述核酸内切酶包括与seq id no:70-78或597中的任一者或其变体具有至少95%序列同一性的序列。
40、在一些方面,本公开提供了一种用于修饰双链脱氧核糖核酸多核苷酸的方法,所述方法包括使所述双链脱氧核糖核酸多核苷酸与复合物接触,所述复合物包括:2类ii型核酸内切酶,碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联,以及经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶和所述双链脱氧核糖核酸多核苷酸结合;其中所述双链脱氧核糖核酸多核苷酸包括原间隔子相邻基序(pam);并且其中所述pam包括选自由seq id no:70-78或597组成的组的序列。在一些实施例中,所述2类ii型核酸内切酶与所述碱基编辑器共价偶联或通过接头与所述碱基编辑器偶联。在一些实施例中,所述碱基编辑器包括与选自seq id no:1-51、57-66、385-443、444-475、594-595或599-675或其变体的序列具有至少70%、至少80%、至少90%或至少95%同一性的序列。在一些实施例中,所述碱基编辑器包括腺嘌呤脱氨酶;所述双链脱氧核糖核酸多核苷酸包括腺嘌呤;并且修饰所述双链脱氧核糖核酸多肽包括将所述腺嘌呤转化为鸟嘌呤。在一些实施例中,所述腺嘌呤脱氨酶包括与seq id no:50-51、57、385-443、448-475或595中的任一者或其变体具有至少70%、80%、90%或95%序列同一性的序列。在一些实施例中,所述碱基编辑器包括胞嘧啶脱氨酶;所述双链脱氧核糖核酸多核苷酸包括胞嘧啶;并且修饰所述双链脱氧核糖核酸多肽包括将所述胞嘧啶转化为尿嘧啶。在一些实施例中,所述胞嘧啶脱氨酶包括与seq id no:1-49、444-447、594或58-66中的任一者或其变体具有至少70%、80%、90%或95%序列同一性的序列。在一些实施例中,所述复合物进一步包括与所述核酸内切酶或所述碱基编辑器偶联的尿嘧啶dna糖基化酶抑制剂。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seq id no:67中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述双链脱氧核糖核酸多核苷酸包括第一链,所述第一链包括与所述经工程化的向导核糖核酸结构的序列互补的序列;以及第二链,所述第二链包括所述pam。在一些实施例中,所述pam与和所述经工程化的向导核糖核酸结构的所述序列互补的所述序列的3'端直接相邻。在一些实施例中,所述2类ii型核酸内切酶不是cas9核酸内切酶、cas14核酸内切酶、cas12a核酸内切酶、cas12b核酸内切酶、cas 12c核酸内切酶、cas12d核酸内切酶、cas12e核酸内切酶、cas13a核酸内切酶、cas13b核酸内切酶、cas13c核酸内切酶或cas 13d核酸内切酶。在一些实施例中,所述2类ii型核酸内切酶源自未培养的微生物。在一些实施例中,所述双链脱氧核糖核酸多核苷酸是真核生物、植物、真菌、哺乳动物、啮齿动物或人双链脱氧核糖核酸多核苷酸。
41、在一些方面,本公开提供了一种修饰靶核酸基因座的方法,所述方法包括向所述靶核酸基因座递送本文所描述的各方面或实施例中的任何方面或实施例的所述经工程化的核酸编辑系统,其中所述核酸内切酶被配置成与所述经工程化的向导核糖核酸结构形成复合物,并且其中所述复合物被配置成使得在所述复合物与所述靶核酸基因座结合时,所述复合物修饰所述靶核酸基因座的核苷酸。在一些实施例中,所述经工程化的核酸编辑系统包括腺嘌呤脱氨酶,所述核苷酸是腺嘌呤,并且修饰所述靶核酸基因座包括将所述腺嘌呤转化为鸟嘌呤。在一些实施例中,所述经工程化的核酸编辑系统包括胞苷脱氨酶和尿嘧啶dna糖基化酶抑制剂,所述核苷酸是胞嘧啶并且修饰所述靶核酸基因座包括将所述腺嘌呤转化为尿嘧啶。在一些实施例中,所述靶核酸基因座包括基因组dna、病毒dna或细菌dna。在一些实施例中,所述靶核酸基因座在体外。在一些实施例中,所述靶核酸基因座在细胞内。在一些实施例中,所述细胞是原核细胞、细菌细胞、真核细胞、真菌细胞、植物细胞、动物细胞、哺乳动物细胞、啮齿动物细胞、灵长类动物细胞或人细胞。在一些实施例中,所述细胞在动物体内。在一些实施例中,所述细胞在耳蜗内。在一些实施例中,所述细胞在胚胎内。在一些实施例中,所述胚胎是双细胞胚胎。在一些实施例中,所述胚胎是小鼠胚胎。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送本文所描述的各方面或实施例中的任何方面或实施例的核酸或本文所描述的各方面或实施例中的任何方面或实施例的载体。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送包括编码所述核酸内切酶的开放阅读框的核酸。在一些实施例中,所述核酸包括编码所述核酸内切酶的所述开放阅读框所可操作地连接的启动子。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送含有编码所述核酸内切酶的所述开放阅读框的加帽mrna。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送经翻译的多肽。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送编码与核糖核酸(rna)pol iii启动子可操作地连接的所述经工程化的向导核糖核酸结构的脱氧核糖核酸(dna)。
42、在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括:核酸内切酶,所述核酸内切酶包括ruvc结构域和hnh结构域,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型核酸内切酶,并且其中所述核酸内切酶被配置成缺乏核酸酶活性;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联。在一些实施例中,所述核酸内切酶包括与seq id no:70-78或597中的任一者或其变体具有至少95%序列同一性的序列。
43、在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括:核酸内切酶,所述核酸内切酶与seq id no:70-78或597中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,其中所述核酸内切酶被配置成缺乏核酸酶活性;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联。在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括:核酸内切酶,所述核酸内切酶被配置成与包括seq id no:360-368或598中的任一者的原间隔子相邻基序(pam)序列结合,其中所述核酸内切酶是2类ii型核酸内切酶,并且其中所述核酸内切酶被配置成缺乏核酸酶活性;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联。在一些实施例中,所述核酸内切酶源自未培养的微生物。在一些实施例中,所述核酸内切酶与cas9核酸内切酶具有小于80%同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述tracr核糖核酸序列包括与选自seq id no:88-96、488、489和679-680中的任一者的约60个至90个连续核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述碱基编辑器包括与seq id no:1-51、57-66、385-443、444-475、594-595或599-675中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述碱基编辑器是腺嘌呤脱氨酶。在一些实施例中,所述腺苷脱氨酶包括与seq id no:50-51、57、385-443、448-475或595中的任一者或其变体具有至少70%、80%、90%或95%序列同一性的序列。在一些实施例中,所述碱基编辑器是胞嘧啶脱氨酶。在一些实施例中,所述胞嘧啶脱氨酶包括与seq id no:1-49、444-447、594或58-66中的任一者或其变体具有至少70%、80%、90%或95%序列同一性的序列。
44、在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括:核酸内切酶,其中所述核酸内切酶被配置成缺乏核酸内切酶活性;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联,其中所述碱基编辑器包括与seq id no:1-51、385-386、387-443、444-447、488-475或595中的任一者或其变体具有至少70%、80%、90%或95%序列同一性的序列。在一些实施例中,所述核酸内切酶被配置成切割双链靶脱氧核糖核酸的一条链。在一些实施例中,所述核酸内切酶被配置成催化死亡。在一些实施例中,所述核酸内切酶是ii类ii型核酸内切酶或ii类v型核酸内切酶。在一些实施例中,所述核酸内切酶包括与seq idno:70-78或597中的任一者或其变体具有至少70%、80%、90%或95%序列同一性的序列。在一些实施例中,所述核酸内切酶包括切口酶突变。在一些实施例中,当最佳比对时,所述核酸内切酶包括在以下处天冬氨酸变为丙氨酸的突变:相对于seq id no:70的残基9、相对于seq id no:71、72或74的残基13、相对于seq id no:73的残基12、相对于seq id no:75的残基17、相对于seq id no:76的残基23或相对于seq id no:597的残基10。在一些实施例中,所述核酸内切酶被配置成与选自由seq id no:360-368或598组成的组的原间隔子相邻基序(pam)序列结合。在一些实施例中,所述碱基编辑器是腺嘌呤脱氨酶。在一些实施例中,所述腺苷脱氨酶包括与seq id no:50-51、385-443或448-475中的任一者或其变体具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施例中,所述腺苷脱氨酶包括与seq id no:50-51、385-390或595中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述碱基编辑器是胞嘧啶脱氨酶。在一些实施例中,所述胞嘧啶脱氨酶包括与seq id no:1-49、444-447中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述多肽进一步包括与所述核酸内切酶或所述碱基编辑器偶联的尿嘧啶dna糖基化酶抑制剂。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seq id no:67中的任一者或其变体具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述核酸内切酶包括接近所述核酸内切酶的n末端或c末端的一个或多个核定位序列(nls)。在一些实施例中,所述nls包括与选自seq id no:369-384或其变体具有至少90%同一性的序列。在一些实施例中,所述核酸内切酶与所述碱基编辑器直接共价偶联或通过接头与所述碱基编辑器共价偶联。
45、在一些方面,本公开提供了一种核酸,其包括经工程化的核酸序列,所述经工程化的核酸序列被优化以在生物体中表达,其中所述核酸编码与seq id no:1-51、385-386、387-443、444-447或488-475中的任一者或其变体具有至少70%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施例中,所述生物体是原核生物、细菌、真核生物、真菌、植物、哺乳动物、啮齿动物或人。
46、在一些方面,本公开提供了一种载体,其包括本文所描述的各方面或实施例中的任何方面或实施例的核酸。在一些实施例中,所述载体是质粒、微环、celid、腺相关病毒(aav)源性病毒体或慢病毒。
47、在一些方面,本公开提供了一种细胞,其包括本文所描述的各方面或实施例中的任一方面或实施例的载体。
48、在一些方面,本公开提供了一种制备碱基编辑器的方法,所述方法包括培养本文所描述的各方面或实施例中的任一方面或实施例的所述细胞。
49、在一些方面,本公开提供了一种系统,其包括:(a)本文所描述的各方面或实施例中的任何方面或实施例的核酸编辑多肽;以及(b)经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸编辑多肽形成复合物,所述经工程化的向导核糖核酸结构包括:向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及核糖核酸序列,所述核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述经工程化的向导核糖核酸序列包括与seq id no:88-96、488-489或679-680中的任一者的非简并核苷酸具有至少80%序列同一性的序列。
50、在一些方面,本公开提供了一种修饰靶核酸基因座的方法,所述方法包括向所述靶核酸基因座递送本文所描述的各方面或实施例中的任何方面或实施例的所述经工程化的核酸编辑多肽或本文所描述的各方面或实施例中的任何方面或实施例的所述系统,其中所述复合物被配置成使得在所述复合物与所述靶核酸基因座结合时,所述复合物修饰所述靶核酸基因座的核苷酸。
51、在一些方面,本公开提供了一种经工程化的核酸编辑系统,其包括:(a)核酸内切酶,所述核酸内切酶包括ruvc结构域和hnh结构域,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型cas核酸内切酶;并且其中所述ruvc结构域缺乏核酸酶活性;(b)碱基编辑器,所述碱基编辑器与所述内切核酸酶偶联;以及(c)经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述经工程化的向导核糖核酸结构包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述核酸内切酶包括与seq id no:70-78中的任一者具有至少95%序列同一性的序列。
52、在一些方面,本公开提供了一种经工程化的核酸编辑系统,其包括:(a)核酸内切酶,所述核酸内切酶与seq id no:70-78中的任一者或其变体具有至少95%序列同一性,其中所述核酸内切酶包括缺乏核酸酶活性的ruvc结构域;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联;以及经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述经工程化的向导核糖核酸结构包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。
53、在一些方面,本公开提供了一种经工程化的核酸编辑系统,其包括:(a)核酸内切酶,所述核酸内切酶被配置成与包括seq id no:360-368的原间隔子相邻基序(pam)序列结合,其中所述核酸内切酶是2类ii型cas核酸内切酶;并且其中所述核酸内切酶包括缺乏核酸酶活性的ruvc结构域;以及(b)碱基编辑器,所述碱基编辑器与所述内切核酸酶偶联;以及(c)经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述经工程化的向导核糖核酸结构包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。
54、在一些实施例中,所述核酸内切酶源自未培养的微生物。在一些实施例中,所述核酸内切酶与cas9核酸内切酶具有小于80%同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述tracr核糖核酸序列包括与选自seq id no:88-96、488、489和679-680中的任一者的约60个至90个连续核苷酸具有至少80%序列同一性的序列。
55、在一些方面,本公开提供了一种经工程化的核酸编辑系统,其包括:(a)经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构包括:(i)向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及(ii)tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与核酸内切酶结合,其中所述tracr核糖核酸序列包括与选自seq id no:88-96、488、489和679-680中的任一者的约60个至90个连续核苷酸具有至少80%序列同一性的序列;以及2类ii型核酸内切酶,所述2类ii型核酸内切酶被配置成与所述经工程化的向导核糖核酸结合。
56、在一些实施例中,所述核酸内切酶被配置成与选自由seq id no:360-368组成的组的原间隔子相邻基序(pam)序列结合。在一些实施例中,所述碱基编辑器包括与seq idno:1-51和385-475中的任一者具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述碱基编辑器是腺嘌呤脱氨酶。在一些实施例中,所述腺苷脱氨酶包括与seq idno:57具有至少95%同一性的序列。在一些实施例中,所述碱基编辑器是胞嘧啶脱氨酶。在一些实施例中,所述胞嘧啶脱氨酶包括与seq id no:58具有至少95%同一性的序列。在一些实施例中,所述胞嘧啶脱氨酶包括与seq id no:59-66中的任一者具有至少95%同一性的序列。
57、在一些实施例中,所述经工程化的核酸编辑系统进一步包括尿嘧啶dna糖基化酶抑制剂。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seqid no:67中的任一者具有至少70%、80%、90%或95%同一性的序列。
58、在一些实施例中,所述经工程化的向导核糖核酸结构包括至少两个核糖核酸多核苷酸。在一些实施例中,所述经工程化的向导核糖核酸结构包括一个核糖核酸多核苷酸,所述核糖核酸多核苷酸包括所述向导核糖核酸序列和所述tracr核糖核酸序列。在一些实施例中,所述向导核糖核酸序列与原核、细菌、古细菌、真核、真菌、植物、哺乳动物或人基因组序列互补。在一些实施例中,所述向导核糖核酸序列的长度是15-24个核苷酸。在一些实施例中,所述核酸内切酶包括接近所述核酸内切酶的n末端或c末端的一个或多个核定位序列(nls)。在一些实施例中,所述核酸内切酶与所述碱基编辑器直接共价偶联或通过接头与所述碱基编辑器共价偶联。在一些实施例中,多肽包括所述核酸内切酶和所述碱基编辑器。在一些实施例中,所述核酸内切酶被配置成切割双链靶脱氧核糖核酸的一条链。在一些实施例中,所述核酸内切酶包括seq id no:370。在一些实施例中,所述系统进一步包括mg2+的来源。
59、在一些实施例中,所述核酸内切酶包括与seq id no:70至少70%、至少80%或至少90%相同的序列;所述向导rna结构包括与seq id no:88至少70%、至少80%或至少90%相同的序列;并且所述核酸内切酶被配置成与包括seq id no:360的pam结合。
60、在一些实施例中,所述核酸内切酶包括与seq id no:71至少70%、至少80%或至少90%相同的序列;所述向导rna结构包括与seq id no:89至少70%、至少80%或至少90%相同的序列;并且所述核酸内切酶被配置成与包括seq id no:361的pam结合。
61、在一些实施例中,所述核酸内切酶包括与seq id no:73至少70%、至少80%或至少90%相同的序列;所述向导rna结构包括与seq id no:91至少70%、至少80%或至少90%相同的序列;并且所述核酸内切酶被配置成与包括seq id no:363的pam结合。
62、在一些实施例中,所述核酸内切酶包括与seq id no:75至少70%、至少80%或至少90%相同的序列;所述向导rna结构包括与seq id no:93至少70%、至少80%或至少90%相同的序列;并且所述核酸内切酶被配置成与包括seq id no:365的pam结合。
63、在一些实施例中,所述核酸内切酶包括与seq id no:76至少70%、至少80%或至少90%相同的序列;所述向导rna结构包括与seq id no:94至少70%、至少80%或至少90%相同的序列;并且所述核酸内切酶被配置成与包括seq id no:366的pam结合。
64、在一些实施例中,所述核酸内切酶包括与seq id no:77至少70%、至少80%或至少90%相同的序列;所述向导rna结构包括与seq id no:95至少70%、至少80%或至少90%相同的序列;并且所述核酸内切酶被配置成与包括seq id no:367的pam结合。
65、在一些实施例中,所述核酸内切酶包括与seq id no:78至少70%、至少80%或至少90%相同的序列;所述向导rna结构包括与seq id no:96至少70%、至少80%或至少90%相同的序列;并且所述核酸内切酶被配置成与包括seq id no:368的pam结合。
66、在一些实施例中,所述碱基编辑器包括腺嘌呤脱氨酶。在一些实施例中,所述腺嘌呤脱氨酶包括seq id no:57。在一些实施例中,所述碱基编辑器包括胞嘧啶脱氨酶。在一些实施例中,所述胞嘧啶脱氨酶包括seq id no:58。在一些实施例中,本文所描述的经工程化的核酸编辑系统进一步包括尿嘧啶dna糖基化抑制剂。在一些实施例中,所述尿嘧啶dna糖基化抑制剂包括seq id no:67。
67、在一些实施例中,所述序列同一性是通过blastp、clustalw、muscle、mafft或史密斯-沃特曼同源性搜索算法来确定的。在一些实施例中,所述序列同一性是通过使用字长(w)为3、期望值(e)为10的参数以及blosum62评分矩阵(将空位罚分设置为存在11,扩展1)并且使用条件组成评分矩阵调整的所述blastp同源性搜索算法来确定的。
68、在一些方面,本公开提供了一种核酸,其包括经工程化的核酸序列,所述经工程化的核酸序列被优化以在生物体中表达,其中所述核酸编码与碱基编辑器偶联的2类ii型核酸内切酶,并且其中所述核酸内切酶源自未培养的微生物。
69、在一些方面,本公开提供了一种核酸,其包括经工程化的核酸序列,所述经工程化的核酸序列被优化以在生物体中表达,其中所述核酸编码与偶联到碱基编辑器的seq idno:70-78中的任一者具有至少70%序列同一性的核酸内切酶。在一些实施例中,所述核酸内切酶包括编码接近所述核酸内切酶的n末端或c末端的一个或多个核定位序列(nls)的序列。在一些实施例中,所述生物体是原核生物、细菌、真核生物、真菌、植物、哺乳动物、啮齿动物或人。
70、在一些方面,本公开提供了一种载体,其包括核酸序列,所述核酸序列编码与碱基编辑器偶联的2类ii型核酸内切酶,其中所述核酸内切酶源自未培养的微生物。在一些实施例中,所述载体包括本文所描述的核酸。在一些实施例中,所述载体进一步包括编码经工程化的向导核糖核酸结构的核酸,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶形成复合物,所述经工程化的向导核糖核酸结构包括:向导核糖核酸序列,所述向导核糖核酸序列被配置成与靶脱氧核糖核酸序列杂交;以及tracr核糖核酸序列,所述tracr核糖核酸序列被配置成与所述核酸内切酶结合。在一些实施例中,所述载体是质粒、微环、celid、腺相关病毒(aav)源性病毒体或慢病毒。在一些方面,本公开提供了一种细胞,其包括本文所描述的载体。在一些方面,本公开提供了一种制备核酸内切酶的方法,所述方法包括培养本文所描述的细胞。
71、在一些方面,本公开提供了一种用于修饰双链脱氧核糖核酸多核苷酸的方法,所述方法包括使所述双链脱氧核糖核酸多核苷酸与复合物接触,所述复合物包括:核酸内切酶,所述核酸内切酶包括ruvc结构域和hnh结构域,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型核酸内切酶,并且其中所述ruvc结构域缺乏核酸酶活性;碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联;以及经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶和所述双链脱氧核糖核酸多核苷酸结合;其中所述双链脱氧核糖核酸多核苷酸包括原间隔子相邻基序(pam)。
72、在一些实施例中,包括ruvc结构域和hnh结构域的所述核酸内切酶与所述碱基编辑器直接共价偶联或通过接头与所述碱基编辑器共价偶联。在一些实施例中,包括ruvc结构域和hnh结构域的所述核酸内切酶包括与seq id no:70-78中的任一者具有至少95%序列同一性的序列。
73、在一些方面,本公开提供了一种用于修饰双链脱氧核糖核酸多核苷酸的方法,所述方法包括使所述双链脱氧核糖核酸多核苷酸与复合物接触,所述复合物包括:2类ii型核酸内切酶,碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联,以及经工程化的向导核糖核酸结构,所述经工程化的向导核糖核酸结构被配置成与所述核酸内切酶和所述双链脱氧核糖核酸多核苷酸结合;其中所述双链脱氧核糖核酸多核苷酸包括原间隔子相邻基序(pam);并且其中所述pam包括选自由seq id no:360-368组成的组的序列。
74、在一些实施例中,所述2类ii型核酸内切酶与所述碱基编辑器共价偶联或通过接头与所述碱基编辑器偶联。在一些实施例中,所述碱基编辑器包括与选自seq id no:1-51和385-475的序列具有至少70%、至少80%、至少90%或至少95%同一性的序列。在一些实施例中,所述碱基编辑器包括腺嘌呤脱氨酶;所述双链脱氧核糖核酸多核苷酸包括腺嘌呤;并且修饰所述双链脱氧核糖核酸多肽包括将所述腺嘌呤转化为鸟嘌呤。在一些实施例中,所述腺嘌呤脱氨酶包括与seq id no:57具有至少95%同一性的序列。
75、在一些实施例中,所述碱基编辑器包括胞嘧啶脱氨酶;所述双链脱氧核糖核酸多核苷酸包括胞嘧啶;并且修饰所述双链脱氧核糖核酸多肽包括将所述胞嘧啶转化为尿嘧啶。在一些实施例中,所述胞嘧啶脱氨酶包括与seq id no:58具有至少95%同一性的序列。在一些实施例中,所述胞嘧啶脱氨酶包括与seq id no:59-66中的任一者具有至少95%同一性的序列。
76、在一些实施例中,所述复合物进一步包括尿嘧啶dna糖基化酶抑制剂。在一些实施例中,所述尿嘧啶dna糖基化酶抑制剂包括与seq id no:52-56或seq id no:67中的任一者具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述双链脱氧核糖核酸多核苷酸包括第一链,所述第一链包括与所述经工程化的向导核糖核酸结构的序列互补的序列,以及第二链,所述第二链包括所述pam。在一些实施例中,所述pam与和所述经工程化的向导核糖核酸结构的所述序列互补的所述序列的3'端直接相邻。
77、在一些实施例中,所述2类ii型核酸内切酶不是cas9核酸内切酶、cas14核酸内切酶、cas12a核酸内切酶、cas12b核酸内切酶、cas 12c核酸内切酶、cas12d核酸内切酶、cas12e核酸内切酶、cas13a核酸内切酶、cas13b核酸内切酶、cas13c核酸内切酶或cas 13d核酸内切酶。在一些实施例中,所述2类ii型核酸内切酶源自未培养的微生物。在一些实施例中,所述双链脱氧核糖核酸多核苷酸是真核生物、植物、真菌、哺乳动物、啮齿动物或人双链脱氧核糖核酸多核苷酸。
78、在一些方面,本公开提供了一种修饰靶核酸基因座的方法,所述方法包括向所述靶核酸基因座递送本文所述的经工程化的核酸编辑系统,其中所述核酸内切酶被配置成与所述经工程化的向导核糖核酸结构形成复合物,并且其中所述复合物被配置成使得在所述复合物与所述靶核酸基因座结合时,所述复合物修饰靶核基因座的核苷酸。
79、在一些实施例中,所述经工程化的核酸编辑系统包括腺嘌呤脱氨酶,所述核苷酸是腺嘌呤,并且修饰所述靶核酸基因座包括将所述腺嘌呤转化为鸟嘌呤。在一些实施例中,所述经工程化的核酸编辑系统包括胞苷脱氨酶和尿嘧啶dna糖基化酶抑制剂,所述核苷酸是胞嘧啶并且修饰所述靶核酸基因座包括将所述腺嘌呤转化为尿嘧啶。在一些实施例中,所述靶核酸基因座包括基因组dna、病毒dna或细菌dna。在一些实施例中,所述靶核酸基因座在体外。在一些实施例中,所述靶核酸基因座在细胞内。在一些实施例中,所述细胞是原核细胞、细菌细胞、真核细胞、真菌细胞、植物细胞、动物细胞、哺乳动物细胞、啮齿动物细胞、灵长类动物细胞或人细胞。在一些实施例中,所述细胞在动物体内。
80、在一些实施例中,所述细胞在耳蜗内。在一些实施例中,所述细胞在胚胎内。在一些实施例中,所述胚胎是双细胞胚胎。在一些实施例中,所述胚胎是小鼠胚胎。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送本文所描述的核酸或本文所描述的载体。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送包括编码所述核酸内切酶的开放阅读框的核酸。
81、在一些实施例中,所述核酸包括编码所述核酸内切酶的所述开放阅读框所可操作地连接的启动子。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送含有编码所述核酸内切酶的所述开放阅读框的加帽mrna。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送经翻译的多肽。在一些实施例中,向所述靶核酸基因座递送所述经工程化的核酸编辑系统包括递送编码与核糖核酸(rna)pol iii启动子可操作地连接的所述经工程化的向导核糖核酸结构的脱氧核糖核酸(dna)。
82、在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括:核酸内切酶,所述核酸内切酶包括ruvc结构域和hnh结构域,其中所述核酸内切酶源自未培养的微生物,其中所述核酸内切酶是2类ii型核酸内切酶,并且其中所述ruvc结构域缺乏核酸酶活性;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联。在一些实施例中,所述核酸内切酶包括与seq id no:70-78中的任一者具有至少95%序列同一性的序列。
83、在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括:核酸内切酶,所述核酸内切酶与seq id no:70-78中的任一者或其变体具有至少95%序列同一性,其中所述核酸内切酶包括缺乏核酸酶活性的ruvc结构域;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联。
84、在一些方面,本公开提供了一种经工程化的核酸编辑多肽,其包括:核酸内切酶,所述核酸内切酶被配置成与包括seq id no:360-368的原间隔子相邻基序(pam)序列结合,其中所述核酸内切酶是2类ii型核酸内切酶,并且其中所述核酸内切酶包括缺乏核酸酶活性的ruvc结构域;以及碱基编辑器,所述碱基编辑器与所述核酸内切酶偶联。
85、在一些实施例中,所述核酸内切酶源自未培养的微生物。在一些实施例中,所述核酸内切酶与cas9核酸内切酶具有小于80%同一性。在一些实施例中,所述核酸内切酶进一步包括hnh结构域。在一些实施例中,所述tracr核糖核酸序列包括与选自seq id no:88-96、488、489和679-680中的任一者的约60个至90个连续核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述碱基编辑器包括与seq id no:1-51和385-475中的任一者具有至少70%、80%、90%或95%同一性的序列。在一些实施例中,所述碱基编辑器是腺嘌呤脱氨酶。在一些实施例中,所述腺苷脱氨酶包括与seq id no:57具有至少95%同一性的序列。在一些实施例中,所述碱基编辑器是胞嘧啶脱氨酶。在一些实施例中,所述胞嘧啶脱氨酶包括与seq id no:58具有至少95%同一性的序列。在一些实施例中,所述腺苷胞嘧啶脱氨酶包括与seq id no:59-66中的任一者具有至少95%同一性的序列。
86、对于本领域技术人员而言,通过以下具体实施方式,本公开的另外的方面和优点将变得显而易见,其中仅示出和描述了本公开的说明性实施例。如将认识到,本公开能够具有其它不同的实施例,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开。因此,附图和说明书本质上被视为是说明性的而非限制性的。
87、通过引用并入
88、本说明书中所提到的所有公开、专利和专利申请均通过以相同的程度引用并入本文,如同特定且单独地指示每个单独的公开、专利或专利申请通过引用并入。
本文地址:https://www.jishuxx.com/zhuanli/20240619/1031.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表