一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种评估用于检测病原体的试剂或试剂组合的有效性的方法及装置

2022-06-15 23:08:15 来源:中国专利 TAG:
1.本发明涉及分子生物学领域,特别涉及一种评估用于检测病原体的试剂的有效性的方法,以及一种评估用于检测病原体的试剂或试剂的组合的有效性的装置。
背景技术
::2.新型冠状病毒肺炎(coronavirusdisease2019,covid-19)为新发急性呼吸道传染病。冠状病毒(coronavirus,cov)是一类具有囊膜,基因组为线性单股正链的rna病毒,是自然界广泛存在的一大类病毒。冠状病毒分为α、β、γ和δ共4个属,其中α和β冠状病毒可以感染哺乳动物,而γ和δ冠状病毒主要感染鸟类。此前已经发现有6种冠状病毒可感染人类:α冠状病毒(hcov-229e、hcov-nl63)和β冠状病毒(hcov-hku1,hcov-oc43、mers-cov、sars-cov),患者表现从普通感冒到重症肺部感染。新型冠状病毒(严重急性呼吸综合征冠状病毒2,sars-cov-2)是一种先前尚未在人类中发现的β属冠状病毒,在人群中具有极强的传染性,主要通过呼吸道飞沫、呼吸道分泌物和直接接触传播。covid-19患者通常表现出特定的相似症状,例如发烧、全身乏力和咳嗽。大多数患者都表现出轻度的流感样症状,预后良好。但少数患者病情危重,并迅速发展为急性呼吸窘迫综合征、呼吸衰竭、多器官衰竭甚至死亡。[0003][0004]新型冠状病毒具有极强的传染性、人群普遍易感、具有潜伏期,并且在潜伏期就具有传染性,因此需要及时地发现感染者、控制传染源,切断传播途径,才能有效地控制疫情的蔓延。而采取一切阻断措施的前提是需要有快速、准确、灵敏的诊断。[0005]目前,国内外市面上有很多新型冠状病毒的确诊方法主要是采用实时荧光pcr技术,特异性检测患者咽拭子、痰和其他下呼吸道分泌物、血液、粪便、尿液等标本中的新型冠状病毒核酸。临床上将核酸检测结果作为诊断的依据之一,但是由于试剂本身的灵敏度问题和病毒待测靶序列的变异问题,核酸检测也会出现假阴性的结果。特别是随着病毒的不断传播与变异的增多,这一问题显得有尤为突出。[0006]很多已有的网页工具和软件,只是提供了病例统计和突变分析的方法,并没有提及怎么利用这些信息指导临床实践,缺乏应用意义。单纯的建模和预测分析,和实际情况往往出入很大,借鉴意义不高。检测新冠病毒的“金标准”还是rt-pcr,rt-pcr是否能带来高灵敏的真实的检测结果往往是疫情传播风险的决定因素。尚未有计算分析工具能对rt-pcr等分子诊断方法进行评价和验证;而rt-pcr的检测是否有效,是否能继续应用到将来和其他更广泛的地区,需要根据病毒的变异情况进行衡量。[0007]因此,一个能整合sars-cov-2突变分析和rt-pcrassay验证分析的分析方法及分析工具显得尤为重要。技术实现要素:[0008]在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。[0009]如本文中所使用的,术语“数据库”是指含有一个或多个(例如,至少10个,至少50个,至少102个,至少5*102个,至少103个,至少5*103个,至少104个,至少5*104个或更多个)病原体的基因组序列信息的数据集合。在本技术中,数据库可以是人工建立的。例如,可通过获取和录入病原体一种或多种(例如,至少10种,至少50种,至少102种,至少5*102种,至少103种,至少5*103种,至少104种,至少5*104种或更多种)株系的基因组序列而建立数据库。此外,数据库也可以是含有多个病原体基因组序列的公共数据库。此类公共数据库包括但不限于:国家生物信息中心(cncb)/国家基因组科学数据中心(ngdc)的数据库、embl核苷酸序列数据库(emblnucleotidesequencedatabase)、ddbj(dnadatabankofjapan,日本dna数据库)、genbank(genbank,基因序列数据库)、mim(onlinemendelianinheritanceinman(omim),人类孟德尔遗传网上数据库)、mgd(mousegenomedatabase,小鼠基因组数据库)、大肠杆菌eco2dbase(escherichiacoligene-proteindatabase(2dgelspots),大肠杆菌基因-蛋白数据库)、tigr(thebacterialdatabase(s)of'theinstituteofgenomeresearch',基因组研究所的细菌数据库)、分支结核杆菌tuberculist(mycobacteriumtuberculosish37rvgenomedatabase,分支结核杆菌h37rv基因组数据库)和hiv(hivsequencedatabasehiv序列数据库)等。在本技术的某些优选实施方案中,数据库中的基因组序列信息具有统一的数据格式。在某些优选实施方案中,数据库中的基因组序列信息以fasta格式进行存储。[0010]如本文中所使用的,“严重急性呼吸综合征冠状病毒2(severeacuterespiratorysyndromecoronavirus2,sars-cov-2)”,旧称为“新型冠状病毒”或“2019-ncov”,属于其β冠状病毒属,为含包膜的单链正义rna病毒。sars-cov-2的基因组序列是本领域技术人员已知的,可参见例如genbank:mn908947。sars-cov-2至少含有三种膜蛋白,包括表面刺突蛋白(s)、整合膜蛋白(m)和膜蛋白(e)。目前新型冠状病毒的检测方法主要针对其基因组中的开放读码框lab(openreadingframelab,orflab)、核壳蛋白(nucleocapsidprotein,n)和包膜蛋白(envelopeprotein,e)等。[0011]如本文中所使用的,术语“新型冠状病毒肺炎”和“covid-19”ꢀ是指,因sars-cov-2感染而导致的肺炎,二者具有相同的含义,可互换使用。[0012]如本文中所使用的,术语“比对”是指将两个或多个多肽的序列或两个或多个核酸的序列进行比较和匹配。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个dna分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是比对同一的。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如align程序(dnastar,inc.)方便地进行的needleman等人(1970)j.mol.biol.48:443-453的方法来实现。还可使用已整合入align程序(版本2.0)的e.meyers和w.miller(comput.applbiosci.,4:11-17(1988))的算法,使用pam120权重残基表(weightresiduetable)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。databasehiv序列数据库)等。[0026]在某些实施方案中,所述数据库是人工建立的数据库。在某些实施方案中,所述数据库通过获取和录入所述病原体一种或多种(例如,至少10种,至少50种,至少102种,至少5*102种,至少103种,至少5*103种,至少104种,至少5*104种或更多种)株系的基因组序列而建立。在某些实施方案中,在将基因组序列录入数据库之前,对所述基因组序列进行预处理。此类预处理包括但不限于:将基因组序列转换为指定的数据格式(例如fasta格式);去除不完整的基因组序列;去除病原体目标宿主不符合要求的基因组序列;去除基因组序列中非碱基(例如a,t,c,g)的特殊字符,或其任何组合。[0027]在某些实施方案中,数据库中的基因组序列信息具有统一的数据格式。在某些优选实施方案中,数据库中的基因组序列信息以fasta格式进行存储。[0028]在某些实施方案中,所述一个或多个基因组序列来源于所述病原体的相同或不同的属,种,亚种,亚型,亚组,亚群或株系。[0029]在某些实施方案中,其中,所述数据库还含有针对一个或多个所述病原体的基因组序列的注释信息。[0030]在某些实施方案中,所述注释信息选自下列:所述基因组序列所来源的病原体的属信息,种信息,亚种信息,亚型信息,亚组信息,亚群信息,株系信息,地域信息,年代信息;所述基因组序列的功能区域,突变区域,突变位点,突变类型,突变频率,保守区域,保守位点;或其任何组合。[0031]在某些实施方案中,所述方法还包括,在进行步骤(2)之前,对一个或多个所述病原体的基因组序列进行注释和/或分析。[0032]在某些实施方案中,针对一个或多个所述病原体的基因组序列,注释选自下列的信息:所述基因组序列所来源的病原体的属信息,种信息,亚种信息,亚型信息,亚组信息,亚群信息,株系信息,地域信息,年代信息,或其任何组合。[0033]在某些实施方案中,针对一个或多个所述病原体的基因组序列进行序列分析;例如,对两个或更多个所述病原体的基因组序列进行序列比对;优选地,在序列比对后,确定和注释所述病原体的基因组序列中选自下列的信息:功能区域,突变区域,突变位点,突变类型,突变频率,保守区域,保守位点,或其任何组合。在某些实施方案中,通过与参考基因组序列进行序列比对,对一个或多个所述病原体的基因组序列进行分析。[0034]在某些实施方案中,在步骤(2)中,将所述核苷酸序列与所述数据库中的所有所述病原体的基因组序列进行序列比对。[0035]在某些实施方案中,在步骤(2)中,根据指定的信息,选择部分所述病原体的基因组序列,然后,将所述核苷酸序列与所选择的基因组序列进行序列比对。优选地,所述指定的信息选自上文所描述的注释信息或其任何组合,例如病原体的属信息,种信息,亚种信息,亚型信息,亚组信息,亚群信息,株系信息,地域信息,年代信息;基因组序列的功能区域,突变区域,突变位点,突变类型,突变频率,保守区域,保守位点;或其任何组合。[0036]在本技术中,可通过各种比对算法将所述核苷酸序列与所述病原体的基因组序列进行序列比对。此类比对算法包括但不限于,needleman等人提出的算法(j.mol.biol.48:443-453(1970)),e.meyers和w.miller提出的算法(comput.applbiosci.,4:11-17(1988)),并且可以用计算机程序(例如align程序,vectornti程序,nucleotidemummer程序等)方便地执行。[0037]在某些实施方案中,其中,在步骤(3)中,根据序列比对结果,确定所述试剂能够靶向的病原体基因组序列的数目或比率,所述试剂靶向的病原体基因组序列的区域,所述区域中包含的突变位点的数目,所述突变位点的突变类型和/或突变类型的频率,所述突变位点的突变频率,所述突变位点在所述区域中的位置,或其任何组合,从而评估所述试剂检测所述病原体的有效性。[0038]不受理论限制,本技术发明人认为,所述试剂能够靶向的病原体基因组序列的数目越多或比率越高,或者,所靶向的区域所含有的突变位点越少,或所含有的突变位点的突变频率越低,或所含有的突变位点距离所述试剂的核苷酸序列的3'端越远,则试剂的有效性越高。反之,所述试剂能够靶向的病原体基因组序列的数目越少或比率越低,或者,所靶向的区域所含有的突变位点越多,或所含有的突变位点的突变频率越多,或所含有的突变位点距离所述试剂的核苷酸序列的3'端越近,则试剂的有效性越低。另外,可利用本技术的方法,对多种试剂的有效性进行同时评估,并确定具有最高有效性的试剂或试剂组合。[0039]因此,在本技术的又一个方面,提供了一种评估用于检测病原体的试剂或试剂的组合的有效性的装置,其特征在于,包括:[0040]存储器;以及[0041]耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如前所述的方法。[0042]在某些实施方案中,所述存储器存储有计算机程序,该程序被处理器执行时实现如前所述的方法。[0043]在某些实施方案中,所述存储器还存储有所述数据库;或者,所述存储器存储有计算机程序,该程序被处理器执行时能够链接存储有数据库的服务器,并获取数据库信息。[0044]在另一个方面,提供了一种非瞬时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前所述的方法。[0045]在本技术的又一个方面,提供了一种检测sars-cov-2的试剂盒,所述试剂盒包含第一试剂组以及第二试剂组,其中,[0046]所述第一试剂组包含第一引物组以及第一检测探针,所述第一引物组和第一检测探针能够靶向sars-cov-2基因组中编码orf1ab蛋白的核苷酸序列;且所述第二试剂组包含第二引物组以及第二检测探针,所述第二引物组和第二检测探针能够靶向sars-cov-2基因组中编码n蛋白的核苷酸序列。[0047]在某些实施方案中,第一引物组包含第一上游引物和第一下游引物,且第一上游引物包含与sars-cov-2的基因组的核苷酸序列(例如genbank:mn908947)的第13342位至第13362位互补的序列。[0048]在某些实施方案中,第一引物组包含第一上游引物和第一下游引物,且第一下游引物包含与sars-cov-2的基因组的核苷酸序列(例如genbank:mn908947)的第13442位至第13460位互补的序列。[0049]在某些实施方案中,第一引物组包含第一上游引物和第一下游引物,第一上游引pcr的新型冠状病毒检测试剂)的有效性和普适性进行判断、分析和预测;[0067](2)本技术的方法和装置可以对新设计的基于核酸序列的病原体(特别是病毒)检测试剂(例如引物和探针)的有效性、覆盖度等进行评估,辅助诊断试剂的开发。[0068]下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。附图说明[0069]图1显示了本技术方法及装置的一个示例性方案的流程示意图。[0070]图2显示了软件输出的交互式界面。[0071]图3显示了usacdc-n1的检测试剂(引物和探针)结合的病毒基因组区域的突变类型和突变频率。[0072]图4显示了通过本技术方法对不同检测试剂(引物和探针)的评估结果。[0073]图5显示了rt-pcr检测方案所使用的引物3’端的5个碱基对应的病毒结合位点的突变类型和突变频率。[0074]图6显示了通过本技术方法对同时使用两组检测试剂的有效性评估,其中,图6a为chinacdc-orf1ab组试剂所结合的病毒基因组区域的突变类型和突变频率,图6b为hku-n组试剂所结合的病毒基因组区域的突变类型和突变频率,图6c为两组检测试剂所结合的病毒基因组区域均存在突变的检测结果,其中,assay1为chinacdc-orf1ab组试剂,assay2为hku-n组试剂。[0075]序列信息[0076]本发明涉及的部分序列的信息提供于下面的表1中。[0077]表1:序列的描述[0078]seqidno:描述序列1chinacdc-orf1ab上游引物ccctgtgggttttacacttaa2chinacdc-orf1ab下游引物acgattgtgcatcagctga3chinacdc-orf1ab探针fam-ccgtctgcggtatgtggaaaggttatgg-bhq14charite-rdrp上游引物gtgaratggtcatgtgtggcgg5charite-rdrp下游引物caratgttaaasacactattagcata6charite-rdrp探针fam-ccaggtggwacrtcatcmggtgatgc-bhq17charite-e上游引物acaggtacgttaatagttaatagcgt8charite-e下游引物atattgcagcagtacgcacaca9charite-e探针fam-acactagccatccttactgcgcttcg-bhq110hku-orf1b上游引物tggggytttacrggtaacct11hku-orf1b下游引物aacrcgcttaacaaagcactc12hku-orf1b探针fam/zen-tagttgtgatgcwatcatgactag-ibfq13hku-n上游引物taatcagacaaggaactgatta14hku-n下游引物cgaaggtgtgacttccatg15hku-n探针fam/zen-gcaaattgtgcaatttgcgg-ibfqmummer)version3.1进行比对。[0095]2.2突变注释[0096]通过比对,确定和获取所输入的病毒基因组序列中的突变信息,包括突变的类型(例如snp、缺失和插入)、位置和序列信息(例如snp位点的核苷酸信息,插入或缺失的核苷酸片段的序列),并将这些突变信息进一步整理成nucmer对象(以用于r语言脚本的输入)。[0097]上述突变信息通过r语言函数实现突变类型的注释与整合。用户在交互界面上可通过调节滑块选择输出图片所展示的观测数,或者打开下拉框,选择不同的国家、基因、图片展示方式等,输出结果可进行调整并下载到本地。[0098]2.3其他信息的注释[0099]对输入的病毒基因组序列的其他信息进行注释,此类其他信息包括:病毒的属信息,种信息,株系信息,分离的地域信息(国家),分离的时间信息。[0100]3.输出信息[0101]3.1病毒基因组序列的分析[0102]对病毒的基因组序列信息进行分析,获取对样本突变基本情况的描述,包括单样本突变率,突变类型频率,全局和局部区域单核苷酸多态以及蛋白突变图谱,单基因突变情况,突变热点等。[0103]3.2rt-pcr引物评价[0104]分析所设计的引物和探针所靶向的病毒区域的突变模式和突变率,可初步反映该引物和探针对数据库中的基因组序列所涉及的病毒样本进行检测的覆盖度和有效性。随着病毒的不断进化,病毒序列数据的不断更新,这些试剂的靶向区域若包含高频突变,往往容易导致检测试剂(引物和探针等)具有较高的假阴性率,使得新冠病毒的分子诊断可靠性下降。rt-pcr作为检测的金标准,设计更好的引物非常重要,靶向区域突变率是一个很好的评价方法。用户获得的突变率可视作评估分数,分数越高,引物的有效性越差。此外,突变位点在引物中的位置也是重要的考虑因素。当突变位点位于引物3’端时,将极大降低rt-pcr的病毒检出率,带来大量假阴性的检测结果。也即,引物的有效性将显著降低。[0105]此外,当用户同时输入多种检测试剂的序列信息时,还可比较不同检测试剂检测病毒的有效性。并且,还可以从中挑选最佳的检测试剂的组合,以获得最高的检测有效性。[0106]3.3其他方面[0107]此外,用户在交互界面上可通过调节滑块选择输出图片所展示的观测数,或者打开下拉框,选择不同的国家、基因、图片展示方式等,输出结果可进行调整并下载到本地。用户可自行选择输入和输出参数,只需点击鼠标,即可显示分析结果并提供下载功能,软件运行的交互式界面具体如图2所示。[0108]实施例2.试剂的有效性评估[0109]按照实施例1描述的方法,以截至2020-08-29的获自gisaid数据库的sars-cov-2基因组数据为基础建立数据库,并进行注释和分析。然后,按照实施例1描述的方法分析usacdc-n1assay(美国疾病预防控制中心)采用的引物和探针所结合的病毒基因组区域的突变情况,评估其有效性。其中,所述引物和探针的具体序列如seqidno:16-18所示。[0110]检测的结果如图3所示,如图3中箭头所指示的,数据库中几乎所有的病毒在此处均有三碱基突变:28311:c→t。也即,usacdc-n1assay(美国疾病预防控制中心)采用的引物和探针所结合的病毒基因组的区域几乎均具有该突变,证实该引物和探针的检测有效性低。因此,通过本技术的方法,能够准确的对试剂的有效性进行评估。[0111]实施例3.试剂的有效性评估[0112]以已经公开的9组用于通过rt-pcr检测sars-cov-2的试剂(引物和探针)为例,按照实施例1描述的方法,以截至2020-08-29的获自gisaid数据库的sars-cov-2基因组数据为基础建立数据库。并将9组试剂(引物和探针)的序列信息输入程序(9组引物和探针的具体序列如表1中seqidno:1-27所示),进行分析和评估,具体分析结果如图4所示。[0113]从图4的结果可以看出,charite-e组检测试剂(seqidno:seqidno:7-9)所靶向的基因组区域具有最低的突变率(0.29057%),因而该组试剂具有最高的检测有效性。而usacdc-n1组检测试剂(seqidno:16-18)所靶向的基因组区域具有最高的突变率(3.1653%),因而该组试剂具有最低的检测有效性。因此,通过本技术的方法,能够对多组试剂的有效性进行评估。[0114]实施例4.引物有效性评估[0115]本实施例评估通过rt-pcr检测sars-cov-2的引物的3’末端5个碱基对应的病毒基因组的结合位点的突变情况,按照实施例1描述的方法,以截至2020-08-29的获自gisaid数据库的sars-cov-2基因组数据为基础建立数据库。并将9组引物的序列信息输入程序(9组引物的具体序列如表1中seqidno:1-27所示),进行分析和评估,具体分析结果如图5所示。[0116]从图5的结果可以看出,靶向sars-cov-2的n基因的引物有效性较差,这些引物的结合区域突变率均较高。其中,thailand-n引物组的突变率为0.22007%,usacdc-n2引物组的突变率为0.2132%,usacdc-n1引物组的突变率为0.20632%,usacdc-n3引物组的突变率为0.09456%。而靶向sars-cov-2的orf1ab基因的引物有效性最好,即chinacdc-orf1ab,这组引物的结合区域突变率均最低,仅为0.01719%。[0117]实施例5.试剂的有效性评估[0118]本实施例对使用两组试剂检测sars-cov-2的有效性进行评估。按照实施例1描述的方法,以截至2020-08-29的获自gisaid数据库的sars-cov-2基因组数据为基础建立数据库。并将chinacdc-orf1ab和hku-n试剂的序列信息输入程序(chinacdc-orf1ab的引物、探针的具体序列如seqidno:1-3所示,hku-n的引物、探针的具体序列如seqidno:13-15所示),进行分析和评估,具体分析结果如图6所示。[0119]从图6的结果可以看出,使用chinacdc-orf1ab和hku-n两组试剂对sars-cov-2进行检测的互补性较好。图6a显示的是chinacdc-orf1ab组试剂所靶向的病毒区域的突变情况,图6c显示仅有291株病毒在chinacdc-orf1ab组试剂所靶向的区域发生突变,图6b显示的是hku-n组试剂所靶向的病毒区域的突变情况,图6c显示仅有598株病毒在hku-n组试剂所靶向的区域发生突变,而仅有2株病毒同时在chinacdc-orf1ab组试剂和hku-n组试剂所靶向的区域发生突变。这意味着同时运用这两组试剂进行的检测的假阴性率将大大降低,同时运用这两组试剂的有效性较好。[0120]综上,通过以上几个实施例证实了使用本技术的方法或装置能够有效的评估用于检测病原体的试剂(例如,引物和探针),并且可以同时评估多组试剂,且评估结果准确,便捷,具有普适性。[0121]尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公开的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献