一种高通量引物特异性筛查方法及应用与流程
- 国知局
- 2024-09-19 14:39:27
本发明涉及属于生物信息学,尤其涉及一种高通量引物特异性筛查方法及应用。
背景技术:
1、在分子生物学研究中,聚合酶链式反应(polymerase chain reaction,pcr)是一项至关重要的技术,用于体外扩增特定的dna片段。pcr实验的成功与否,很大程度上取决于引物的设计质量。引物设计的成功与否直接影响到pcr扩增的特异性、灵敏度和准确性,进而影响分子检测的结果。
2、引物特异性是pcr实验设计中的一个核心要素。特异性良好的引物能够准确扩增目标dna片段,避免非特异性扩增带来的干扰和误判。因此,引物特异性筛查成为pcr实验前不可或缺的一个环节。
3、目前,市场上存在多种引物特异性筛查工具,其中,ncbi的在线版本只能单个提交分析,无法实现批量化和高通量的分析,而且由于网络等问题,该网站容易掉线,无法给出结果,mfeprimer3比对分析慢,而且结果复杂,是对所有引物进行特异性分析,而不是针对引物对进行特异分析,因此其给出的特异性结果还需要进一步人工复核和完善,耗费人工和时间。
技术实现思路
1、本发明所要解决的技术问题是提供一种高通量引物特异性筛查方法及应用,旨解决上述至少一个技术问题。
2、本发明解决上述技术问题的技术方案如下:
3、第一方面,本技术提供一种高通量引物特异性筛查方法,采用如下技术方案:
4、一种高通量引物特异性筛查方法,包括:
5、获取所述目标物种的第一引物序列文件,所述第一引物序列文件包括多个引物序列,每个所述引物序列为单独的正向引物序列或反向引物序列;
6、基于预设的短序列比对模式,将所述第一引物序列文件中的每个引物序列与所述目标物种对应的数据库中的基因组序列进行比对,得到所述目标物种的第一引物比对结果,所述第一比对结果至少包括每个引物序列在基因组序列中的比对位置;
7、基于预设的汇整规则对各个所述引物序列进行汇整,得到引物列表,将所述引物列表作为第二引物序列文件,所述引物列表中包括由正向引物序列和反向引物序列组合成的引物对,一个所述引物对对应一个正向引物序列和一个反向引物序列;
8、基于预设的探针比对工具,将第二引物序列文件中各个引物对作为序列探针,分别将各个引物对与所述数据库中的基因组序列进行比对,得到各个引物对的第二引物比对结果,所述第二引物比对结果至少包括每个引物对的引物对名称、基因名称、每个所述正向引物序列在所述基因组序列的起始位置和每个所述反向引物序列在所述基因组序列的终止位置;
9、基于所述第二引物比对结果对所述第一引物比对结果进行修正,得到特异性唯一的至少一个比对的引物对的特异性结果。
10、本发明的有益效果是:利用短序列比对,确认结果的准确性,同时利用成对引物快速映射,提高引物对的比对效率,可以短时间的给出准确的引物比对结果。
11、通过比对目标物种的引物序列到对应的数据库,将短引物对序列,先锚定多个相似度高的位置,然后利用第一引物比对结果,进行锁定正确的比对位置。可以完成大量引物对的快速分析比对工作,筛选最特异性的引物对。
12、通过基于比对结果进行修正,可以确保筛选出的引物对具有高度的特异性,减少非特异性扩增的可能性,从而提高实验结果的准确性和可靠性。该方法能够同时处理多个引物序列,并且利用自动化工具进行比对和筛选,显著提高了引物设计和筛选的效率,实现了高通量的引物特异性筛查,减少实验成本和时间。
13、在上述技术方案的基础上,本发明还可以做如下改进。
14、进一步,在获取所述目标物种的第一引物序列文件之前,还包括:
15、选取所述目标物种的多个snp位点,并基于所述目标物种的多个所述snp位点和预设的序列提取规则提取每个所述snp位点对应的目标序列;
16、基于各个所述snp位点各自对应的目标序列和预设的引物设计规则,确定各个所述snp位点各自对应的多个引物序列;
17、对目标物种的多个引物序列进行预处理,得到第一引物序列文件,所述第一引物序列中的每个引物序列均以fasta格式表示。
18、采用上述进一步方案的有益效果是:
19、通过选取目标物种的多个snp位点,并基于这些snp位点和预设的序列提取规则提取对应的目标序列,可以确保引物设计是针对具体的snp位点进行的。这种针对性的设计使得引物在pcr扩增时能够更准确地覆盖目标snp位点,提高实验的准确性。基于各个snp位点各自对应的目标序列和预设的引物设计规则,可以确定出多个符合要求的引物序列。这些引物序列在设计时就考虑到了特异性,因此在实际应用中能够减少非特异性扩增的可能性,提高实验结果的可靠性。通过自动化的引物设计和筛选流程,可以快速生成大量针对特定snp位点的引物序列,并进行高通量的引物特异性筛查。这大大减少了手动设计和筛选引物的工作量,提高了实验效率。
20、进一步,所述基于预设的短序列比对模式,将所述第一引物序列文件中的每个引物序列与所述目标物种对应的数据库中的基因组序列进行比对,得到所述目标物种的第一引物比对结果,包括:
21、通过数据库索引构建工具,为所述目标物种的数据库中的基因组序列建立索引,一个索引对应一个基因组序列;
22、基于预设的短序列比对模式和预设的设定参数,将所述第一引物序列文件中的每个引物序列与已建立索引的数据库中的基因组序列进行比对,以在所述基因组序列中找到与所述第一引物序列文件中的每个所述引物序列相匹配的至少一个序列片段,所述设定参数包括单词长度、期望值的阈值和比对的线程数;
23、基于各个所述引物序列相匹配的至少一个序列片段,确定所述目标物种的第一引物比对结果。
24、采用上述进一步方案的有益效果是:
25、通过为数据库建立索引,可以加速序列比对过程。索引使得查询操作能够更快速地定位到目标区域,将短引物对序列锚定多个相似度高的位置,减少不必要的搜索和比对,从而显著提高比对效率。
26、预设的短序列比对模式和设定参数条件(如单词长度、期望值的阈值和比对的线程数)可以根据具体需求进行调整,以优化比对结果。这些参数的设置可以确保比对过程在保持一定速度的同时,也达到较高的准确性。
27、进一步,所述基于预设的探针比对工具,将第二引物序列文件中各个引物对应的正向引物序列和反向引物序列均作为序列探针,映射到所述数据库中进行比对,得到第二引物比对结果,包括:
28、基于预设的探针比对工具,将第二引物序列文件中各个引物对应的正向引物序列和反向引物序列均作为序列探针;
29、基于预设的错配碱基数,将所述正向引物序列和所述反向引物序列映射到所述数据库中,确定每对引物在参考序列上的位置区间;
30、基于所述每对引物的位置区间,确定每对引物的引物对名称、比对到数据库的基因名称、正向引物的起始位置和反向引物的终止位置。
31、采用上述进一步方案的有益效果是:
32、通过将正向引物序列和反向引物序列均作为序列探针,该方法能够更准确地识别引物在参考序列上的特异性结合位点。这有助于确保后续实验(如pcr扩增)的特异性和准确性。通过预设的错配碱基数限制,该方法能够精确地确定每对引物在参考序列上的位置区间。这对于了解引物的具体作用位置和可能影响的基因区域非常重要。
33、进一步,所述基于所述第二比对结果对所述第一比对结果进行修正,得到特异性唯一的至少一个比对的引物对的特异性结果,包括:
34、基于预设的整理规则对第一比对结果进行整理,得到各个引物序列的正向引物比对结果或反向引物比对结果,所述正向引物比对结果至少包括正向引物序列名称、正向引物序列对应的基因名称、正向引物比对到所述基因组序列的起始位置,所述反向引物比对结果至少包括反向引物序列名称、反向引物序列对应的基因名称、反向引物比对到基因组序列的终止位置;
35、在所述第二比对结果中筛选出与所述正向引物比对结果正确比对的序列,生成正向修正文件;
36、在所述第二比对结果中筛选出与所述反向引物比对结果正确比对的序列,生成反向修正文件;
37、比对所述正向修正文件和反向修正文件,删除比对到所述基因组序列中存在多个比对位置的引物对,得到特异性唯一的至少一个比对的目标引物对的特异性结果,所述特异性结果至少包括目标引物名称、目标引物比对到的基因名、目标引物起始位置、目标引物终止位置、目标引物错配数和目标引物扩增子长度。
38、采用上述进一步方案的有益效果是:通过生成正向修正文件和反向修正文件,可以清晰地了解每个引物的比对情况,包括比对到的基因名称、起始位置和终止位置等关键信息。通过比对正向修正文件和反向修正文件,并删除比对到参考基因组多个位置的引物对,可以大大降低假阳性结果的发生率,提高实验结果的可靠性。该方法能够自动化处理大量的比对数据,快速生成修正文件和特异性结果。这大大减少了手动分析和筛选的工作量,提高了实验效率。
39、进一步,所述目标物种为病原物种或植物物种,所述病原物种包括肺炎链球菌,所述植物物种包括水稻。
40、采用上述进一步方案的有益效果是:无论是针对病原物种还是植物物种,高通量引物特异性筛查方法具有提高工作效率,减少成本的效果,相比于现有技术无需后续人工进一步分析即可实现高通量引物的特异性筛查。
41、进一步,还包括:
42、通过筛查出的多个引物对合成的多重pcr引物混合物进行多重pcr反应,并通过pcr引物混合物的pcr扩增电泳图来验证各个引物对的特异性。
43、采用上述进一步方案的有益效果是:
44、通过多重pcr反应和pcr扩增电泳图,可以直接观察到各个引物对在特定条件下的扩增效果,从而验证引物的特异性。这有助于确保后续实验中使用的引物具有高度的特异性,减少非特异性扩增的可能性。
45、通过pcr扩增电泳图,可以直观地比较不同引物对的扩增效果,从而优化引物选择。
46、进一步,所述的一种高通量引物特异性筛查方法在病原引物特异性筛查或植物引物特异性筛查中的应用。
47、采用上述进一步方案的有益效果是:
48、第二方面,本技术提供一种高通量引物特异性筛查方法的应用,采用如下技术方案:
49、一种高通量引物特异性筛查方法在病原引物特异性筛查或植物引物特异性筛查中的应用。
50、第三方面,本技术提供一种电子设备,采用如下技术方案:
51、一种电子设备,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行第一方面任一项所述的一种高通量引物特异性筛查方法的计算机程序。
52、第四方面,本技术提供一种计算机可读存储介质,采用如下技术方案:
53、一种计算机可读存储介质,存储有能够被处理器加载并执行第一方面任一项所述的高通量引物特异性筛查方法的计算机程序。
54、本技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本技术的实践了解到。
本文地址:https://www.jishuxx.com/zhuanli/20240919/299443.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。