技术新讯 > 有机化合物处理,合成应用技术 > 基于转座酶的基因组分析的制作方法  >  正文

基于转座酶的基因组分析的制作方法

  • 国知局
  • 2024-06-20 11:00:01

背景技术:

1、现代测序文库的制备通常涉及引入tn5转座酶的高活性变体,该变体介导双链dna的片段化并在5分钟的反应中将合成的寡核苷酸两端连接(adey a等,genome biol 11:r119(2010))。野生型tn5转座子是复合型转座子,其中2个几乎相同的插入序列(is50l和is50r)侧接3个抗生素抗性基因(reznikoff ws.annu rev genet 42:269-286(2008))。各is50包含2个反向19-bp末端序列(es),外侧端(outside end,oe)和内侧端(inside end,ie)。然而,野生型es的活性相对较低并且被过分活跃的镶嵌端(mosaic end,me)序列体外取代。因此,具有19-bp me的转座酶复合物是转座发生所必需的,只要间插dna足够长以使这些序列中的两个靠近在一起形成活性tn5转座酶同二聚体(reznikoffws.,molmicrobiol 47:1199-1206(2003))。转座在体内是非常罕见的事件,并且过分活跃的突变体历史上源自tn5蛋白的476个残基中导入三个错义突变(e54k、m56a、l372p),其由is50r编码(goryshin iy,reznikoffws.1998.j biol chem 273:7367-7374(1998))。转座通过“剪切-和-粘贴”机制起作用,其中tn5将其从供体dna中切除并插入靶序列,产生靶标的9-bp重复(schaller h.cold spring harb symp quant biol 43:401-408(1979);reznikoff ws.,annu rev genet 42:269-286(2008))。在当前的商业解决方案(nextera dna试剂盒,亿明达公司(illumina))中,游离的合成me衔接子与靶dna的5′-末端通过转座酶末端连接。

技术实现思路

0、发明概述

1、在一些实施方式中,提供了条码化dna的方法。在一些实施方式中,该方法包括

2、通过使dna与载有寡核苷酸衔接子的转座酶接触向dna中随机引入寡核苷酸衔接子,其中寡核苷酸衔接子包含3′单链部分和双链部分,第一寡核苷酸具有3′末端和5′末端并且是双链部分的链,第二寡核苷酸包含单链部分和双链部分的互补链,和

3、其中转座酶将双链断裂引入dna中,其中每个双链断裂形成两个dna末端,并且转座酶将第一寡核苷酸连接至每个dna末端的一条链,以形成在两端包含寡核苷酸衔接子的dna片段;

4、形成液滴,其中所述液滴包含dna片段和具有珠特异性条码序列的第一寡核苷酸引物,其中第一寡核苷酸引物与珠连接,并包含与寡核苷酸衔接子的3′单链部分互补的游离3′末端;

5、使第一寡核苷酸引物(可选地从珠释放)的3′末端与寡核苷酸衔接子的3′单链部分杂交;

6、合并液滴的内容物以形成反应混合物;

7、使反应混合物与连接酶接触,从而将第一寡核苷酸引物连接至与dna末端连接的第一寡核苷酸的5′末端,从而形成条码化的dna片段。

8、在一些实施方式中,该方法进一步包括扩增条码化的片段。在一些实施方式中,扩增包括聚合酶链式反应。

9、在一些实施方式中,该方法包括在杂交之前从dna中剥离转座酶。在一些实施方式中,剥离发生在液滴中。在一些实施方式中,dna在核中,并且剥离在液滴形成之前发生。

10、在一些实施方式中,该方法包括在杂交之前从珠上切割寡核苷酸引物。

11、在一些实施方式中,转座酶载有具有相同的双链部分和不同的单链部分的两个不同的衔接子寡核苷酸。在一些实施方式中,液滴还包含第二寡核苷酸引物,其中第二寡核苷酸引物包含与单链部分之一至少50%(例如,至少60%,70%,80%,90%或100%)互补的3′末端序列,并且第一寡核苷酸引物包含与不同的3′单链部分至少50%(例如60%,70%,80%,90%或100%)互补的游离3′末端,并且杂交包括使第二寡核苷酸引物与互补的3′单链部分杂交。在一些实施方式中,一个单链部分包含gacgctgccgacga(a14;seq id no:1),而另一个单链部分包含ccgagcccacgagac(b15;seq id no:2)。

12、在一些实施方式中,转座酶载有两个相同的衔接子寡核苷酸。

13、在一些实施方式中,第一寡核苷酸引物包含5′pcr柄序列。在一些实施方式中,第一寡核苷酸引物的5′pcr柄序列包含aatgatacggcgaccaccgagatctacac(p5;seq id no:3)。在一些实施方式中,液滴进一步包含第二寡核苷酸引物,并且其中第二寡核苷酸引物包含5′pcr柄。在一些实施方式中,第二寡核苷酸引物的5′pcr柄包括caagcagaagacggcatacgagat(p7;seq id no:4)。在一些实施方式中,第二寡核苷酸引物进一步包含索引标签(例如,条码)。

14、在一些实施方式中,第二寡核苷酸的单链部分包括:

15、i.与第一寡核苷酸引物小于50%互补的3′末端序列;和

16、ii.与第一寡核苷酸引物的游离3′末端至少50%(例如,至少60%,70%,80%,90%或100%)互补的中间序列。

17、在一些实施方式中,dna在引入过程中包含dna结合的蛋白质。在一些实施方式中,该方法进一步包括在合并后从dna中去除dna结合的蛋白质。在一些实施方式中,去除包括使dna与离液剂或蛋白酶接触。在一些实施方式中,该方法进一步包括在合并前从dna中去除dna结合的蛋白质。在一些实施方式中,去除包括使dna与离液剂或蛋白酶接触。

18、在一些实施方式中,与dna相比,该形成维持dna片段的相邻性(contiguity)。在一些实施方式中,dna在合并之后和接触之前被纯化。

19、在一些实施方式中,该方法进一步包括在合并期间,将液滴的内容物与包含单链部分的竞争性寡核苷酸混合,该竞争性寡核苷酸与第一寡核苷酸引物的未结合拷贝的3′末端杂交,从而防止合并后未结合的dna片段的从头结合。

20、在一些实施方式中,该方法进一步包括在合并期间,将液滴的内容物与包含单链部分的竞争性寡核苷酸混合,该竞争性寡核苷酸与寡核苷酸衔接子的未结合拷贝的3′末端杂交,从而防止合并后未结合的dna片段的从头结合。

21、在一些实施方式中,竞争性寡核苷酸包含不能通过聚合酶延伸的3′末端。

22、在一些实施方式中,接触中的聚合酶是链置换聚合酶。

23、在一些实施方式中,接触中的聚合酶具有5’-3’核酸外切酶活性。

24、在一些实施方式中,转座酶是tn5转座酶。

25、在一些实施方式中,转座酶与珠连接。

26、在一些实施方式中,该方法进一步包括对条码化的dna序列进行测序,其中测序包括杂交测序引物并将其延伸至条码化的dna序列。在一些实施方式中,测序引物包含一个或多个人工核苷酸,其形成比天然核苷酸中更高的亲和性碱基配对。

27、定义

28、除非另有说明,本文所用的所有科技术语具有本发明所属领域普通技术人员通常所理解的含义。通常,本文所用的命名和下述细胞培养、分子遗传学、有机化学和核酸化学以及杂交中的实验室步骤均为本领域熟知和常用的。使用标准技术进行核酸和肽合成。按照本领域和各种通用参考文献所述的常规方法进行这些技术和步骤(通常参见,sambrook等,《分子克隆:实验室手册》(molecular cloning:a laboratory manual),第2版(1989)冷泉港实验室出版社(cold spring harbor laboratory press),纽约冷泉港(cold springharbor,n.y.),其通过引用纳入本文),全文中提供这些参考文献。本文所用的命名以及下述分析化学和有机合成中的实验室步骤均为本领域熟知且常用。

29、术语“扩增反应”指用于以线性或指数方式倍增核酸靶序列拷贝的各种体外方法。这类方法包括但不限于聚合酶链式反应(pcr);dna连接酶链反应(参见美国专利号4,683,195和4,683,202,pcr protocols:a guide to methods and applications(pcr方案:方法和应用指南)(innis等编,1990))(lcr);基于qbeta rna复制酶和基于rna转录的扩增反应(例如,涉及t7、t3或sp6引导的rna聚合),例如转录扩增系统(tas),基于核酸序列的扩增(nsaba),和自主维持序列复制(3sr);等温扩增反应(例如,单引物等温扩增(spia));以及本领域技术人员已知的其它方法。

30、“扩增”指将溶液置于足以扩增多核苷酸的条件下的步骤(如果反应的所有组分是完整的)。扩增反应的组分包括,例如,引物、多核苷酸模板、聚合酶、核苷酸等。术语“扩增”通常指靶核酸的“指数型”增长。然而,本文所用的“扩增”也可指核酸的选择靶序列数量的线性增长,如由循环测序或线性扩增所得。在一个示例性实施方式中,扩增是指使用第一和第二扩增引物的pcr扩增。

31、术语“扩增反应混合物”指包含用于扩增靶核酸的各种试剂的水性溶液。这些试剂包括酶、水性缓冲剂、盐、扩增引物、靶核酸和三磷酸核苷。扩增反应混合物还可包含稳定剂和其它添加剂以优化效率和特异性。根据上下文,该混合物还可以是完整或不完整的扩增反应混合物。

32、“聚合酶链式反应”或“pcr”是指靶双链dna的特定区段或子序列得以几何级数式扩增的一种方法。pcr是本领域技术人员所熟知的;参见例如,美国专利号4,683,195和4,683,202;和《pcr方案:方法和应用指南》,innis等编,1990。示例性pcr反应条件一般包括两步或三步循环。两步循环具有变性步骤,之后是杂交/延伸步骤。三步循环包括变性步骤,之后是杂交步骤,之后是独立的延伸步骤。

33、“引物”是指与靶核酸上的序列杂交并用作基于模板的核酸合成(例如通过引物延伸或pcr)的起始点的多核苷酸序列。引物可以是各种长度的并且通常长度小于50个核苷酸,例如长度为12-30个核苷酸。可基于本领域技术人员已知的原理设计用于引物延伸或pcr的引物的长度和序列,参见例如innis等(同上)。引物可以是dna、rna或dna部分与rna部分的嵌合体。在一些情况中,引物可包括一个或多个带修饰或非天然的核苷碱基。在一些情况中,引物被标记。

34、术语“衔接子”仅仅是区分混合物中不同寡核苷酸的术语。如本文所用,“衔接子”用于寡核苷酸(其在化学上是不可区分的或与其他寡核苷酸不可区分的),所述寡核苷酸已被加载到转座酶上,或随后在dna的转座酶片段化之后被转座酶连接至dna末端。

35、核酸或其部分与另一核酸“杂交”的某些条件使得生理缓冲液(例如,ph6-9,25-150mm盐酸盐)中限定温度下的非特异性杂交最少。在一些情况中,核酸或其部分与一组靶核酸之间共有的保守序列杂交。在一些情况中,如果包括与超过一个核苷酸伴侣互补的“通用”核苷酸在内有至少约6、8、10、12、14、16或18个连续的互补核苷酸,引物或其部分能杂交至引物结合位点。或者,如果在至少约12、14、16或18个连续的互补核苷酸中有不到1或2个互补错配,引物或其部分能杂交至引物结合位点。在一些实施方式中,发生特异性杂交的限定温度是室温。在一些实施方式中,发生特异性杂交的限定温度高于室温。在一些实施方式中,发生特异性杂交的限定温度为至少约37、40、42、45、50、55、60、65、70、75或80℃。在一些实施方式中,发生特异性杂交的限定温度为37、40、42、45、50、55、60、65、70、75或80℃。为了发生杂交,引物结合位点和杂交的引物部分将至少基本上互补。“基本上互补”是指引物结合位点具有包含至少6、8、10、15或20(例如4-30、6-30、4-50)个连续碱基区域的碱基序列,该连续碱基区域与引物序列中存在的相等长度的连续碱基区域至少50%,60%,70%,80%,90%或95%互补。“互补的”是指两条核酸链的多个连续核苷酸可供具有标准的沃森-克里克碱基配对。对于特定的参考序列,100%互补是指一条链中的每个核苷酸与第二条链中连续序列上的核苷酸互补(标准碱基配对)。

36、“模板”指包含待扩增的多核苷酸、其侧或为一对引物杂交位点的多核苷酸序列。因此,“靶模板”包含毗邻引物的至少一个杂交位点的靶多核苷酸序列。在一些情况中,“靶模板”包含侧接有“正向”引物和“反向”引物的杂交位点的靶多核苷酸序列。

37、本文所用的“核酸”表示dna、rna、单链、双链、或更高度聚集的杂交基序及其任意化学修饰。修饰包括但不限于,提供引入其它电荷、极化性、氢键、静电相互作用、与核酸配体碱基或核酸配体整体的连接点和作用点的化学基团的那些修饰。这类修饰包括但不限于,肽核酸(pna)、磷酸二酯基团修饰(例如,硫代磷酸酯、甲基膦酸酯)、2′-位糖修饰、5-位嘧啶修饰、8-位嘌呤修饰、环外胺处的修饰、4-硫尿核苷的取代、5-溴或5-碘-尿嘧啶的取代、骨架修饰、甲基化、不常见的碱基配对组合如异碱基(isobase)、异胞苷和异胍(isoguanidine)等。核酸也可包含非天然碱基,如硝基吲哚。修饰还可包括3′和5′修饰,包括但不限于用荧光团(例如,量子点)或其他部分加帽。

38、“聚合酶”是指能进行模板引导的多核苷酸(例如,dna和/或rna)合成的酶。该术语同时包括全长多肽和具有聚合酶活性的结构域。dna聚合酶是本领域技术人员熟知的,包括但不限于分离或衍生自激烈火球菌(pyrococcus furiosus)、滨海嗜热球菌(thermococcuslitoralis)和海栖热袍菌(thermotoga maritime)的dna聚合酶或其修饰版本。市售可得的聚合酶的其它示例包括但不限于:克列诺(klenow)片段(new england公司)、taqdna聚合酶(凯杰公司(qiagen))、9°ntm dna聚合酶(new england公司)、deepventtm dna聚合酶(new england公司)、manta dna聚合酶(酶学公司)、bst dna聚合酶(new england公司)和phi29dna聚合酶(new england公司)。

39、聚合酶包括dna依赖性聚合酶和rna依赖性聚合酶,如逆转录酶。已知至少5个dna依赖性dna聚合酶家族,虽然大多数落入a、b和c家族。其它类型dna聚合酶包括噬菌体聚合酶。相似地,rna聚合酶通常包括真核rna聚合酶i、ii和iii,和细菌rna聚合酶以及噬菌体和病毒聚合酶。rna聚合酶可以是dna依赖性和rna依赖性的。

40、本文所用术语“划分”或“经划分的”指将样品分为多个部分或多个“分区(partition)”。分区通常是实体意义上的,例如,一个分区中的样品不与或基本不与邻近分区中的样品混合。分区可以是固体或流体。在一些实施方式中,分区是固体分区,例如微通道。在一些实施方式中,分区是流体分区,例如液滴。在一些实施方式中,流体分区(如液滴)是不互溶的流体(如水和油)的混合物。在一些实施方式中,流体分区(如液滴)是水性液滴,其被不互溶的运载体流体(如油)包围。

41、如本文所用“条码”是鉴别其所偶联分子的短核苷酸序列(例如,长至少约4、6、8、10、12、15、20或50个核苷酸或更长)。例如,条码可用来鉴定划分产物中的分子。相对于其它分区的条码,这样的分区特异性条码应为该分区所独特。例如,包含来自单个细胞的靶rna的分区可以经受逆转录条件,在各分区中使用包含不同分区特异性的条码序列的引物,从而将独特“细胞条码”的拷贝纳入各分区的逆转录所得核酸。由此,来自各细胞的核酸可藉由独特“细胞条码”而与其它细胞的核酸相区分。在其他实例中,可以使用在每个分区中包含不同分区特异性条码序列的引物使含有cpt-dna的分区经历pcr条件,从而将独特的cpt-dna条码的拷贝掺入每个分区的pcr扩增子中。底物可以是细胞rna,细胞dna和/或长连续dna分子。一些情况中,底物条码是由偶联至颗粒的寡核苷酸上存在的“颗粒条码”(也称为“珠特异性条码”)来提供,其中所述颗粒条码为偶联至该颗粒的全部或基本全部寡核苷酸所共有(例如,在它们之间相同或基本相同)。因此,底物和颗粒条码可存在于分区中、附着于颗粒或结合细胞核酸,以同一条码序列的多个拷贝。可以将具有相同序列的底物或颗粒条码识别为源自相同的底物(例如已被切割但保持相邻性的长dna分子),细胞,分区或颗粒。

42、其它情况中,条码专一性鉴别其偶联的分子。例如,通过使用各自含有独特“分子条码”的引物进行逆转录。同样在另一些实施例中,可以利用包含针对各分区独特的“分区特异性条码”、以及针对各分子独特的“分子条码”的引物。条码化之后,可以合并分区,并任选地扩增,而保持虚拟分区。因此,例如,可计算包括各条码的靶核酸(例如,逆转录所得的核酸)的存在与否(例如,通过测序),而无需维持实体分区。

43、条码序列的长度决定了可以对多少独特的样品进行区分。例如,1个核苷酸条码可以对不多于4个样品或分子进行分区;4个核苷酸条码可以对不多于44(即256)个样品进行分区;6个核苷酸条码可以对不多于4096个不同样品进行分区;而8个核苷酸的条码可以标引不多于65,536个不同样品。另外,条码可以例如通过连接或在转座酶反应中附连。

44、通常使用固有不精确的过程来合成和/或聚合(例如,扩增)条码。因此,旨在均一的条码(例如,单个分区、细胞或珠的全部条码化核酸所共有的细胞、底物、颗粒或分区特异性条码)可以相对于范本条码序列包含不同的n-1缺失或其它突变。因此,被称作“相同的”或“基本相同的”拷贝的条码是指由于例如合成、聚合或纯化错误中一个或多个错误而导致条码相对范本条码序列含有不同的n-1缺失或其它突变的不同的条码。此外,在使用例如拆分与汇集方法和/或核苷酸前体分子等同混合物的合成过程中,条码核苷酸的随机偶联可能导致低概率事件,其中条码并非绝对独特(例如,不同于群体的其它条码,或不同于不同分区、细胞或珠的条码)。但是,这类偏离理论上理想的条码的轻微偏差不会干扰本文所述的高通量测序分析方法、组合物和试剂盒。因此,如本文所用,术语“独特”在涉及颗粒、底物、细胞、分区特异性或分子条码的内容中涵盖偏离理想条码序列的各种非有意的n-1缺失和突变。一些情况中,由于条码合成、聚合和/或扩增所致的不精确性质造成的问题通过对与待区分的条码序列的数量相比进行可能的条码序列的过量采样(oversampling)来克服(例如,至少约2、5、10倍或更多倍的可能的条码序列)。例如,可用具有9个条码核苷酸的细胞条码(代表262,144个可能的条码序列)来分析10,000个细胞。本领域熟知条码技术的使用,参见例如katsuyuki shiroguchi等人proc natl acad sci u s a.,2012年1月24日109(4):1347-52和smith,am等人的nucleic acids research can 11,(2010)。使用条码技术的其他方法和组合物包括u.s.2016/0060621中描述的那些。

45、“转座酶”或“标签酶”(在本文中同义使用)是指这样的酶,所述酶能够与含转座子末端的组合物形成功能性复合物并催化含转座子末端的组合物插入或转移到与该组合物在体外转座反应中孵育的双链靶dna中。示例性的转座酶包括但不限于相较于野生型tn5过分活跃的修饰的tn5转座酶,例如,可以具有选自e54k、m56a或l372p或如背景技术部分中所述的一个或多个突变。

46、“合并液滴的内容物”是指形成多个液滴的内容物的连续混合物的任何方式。例如,当乳液中存在液滴时,乳液破裂(从而在乳液中混合液滴的内容物)通过添加试剂或通过施加物理力来实现。例如,可以添加表面活性剂(例如,全氟辛醇)和/或加热。力的选择包括重力和/或离心。

本文地址:https://www.jishuxx.com/zhuanli/20240619/859.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。