一种低序列数核酸鉴别方法及系统与流程
- 国知局
- 2024-07-12 10:42:32
本发明涉及一种低序列数核酸鉴别方法及系统,属于低序列核酸鉴领域。
背景技术:
1、核酸检测是一种分子诊断技术,它可以分析感染样本中的碱基排列顺序,从而判断寄生菌种并对寄生菌种进行鉴别,低序列数核酸为低分子量、低序列复杂度的核酸,由较少的碱基对组成。
2、目前低序列核酸鉴别通常使用微阵列技术、高通量测序和实时定量pcr,微阵列技术需要大量的起始样本和特殊的芯片和设备,高通量测序为测定整个基因组或转录组的方法,实时定量pcr用于检测特定的基因或核酸片段。
3、微阵列技术、高通量测序和实时定量pcr三种方法虽然都能够进行低序列核酸的鉴别,但是微阵列技术需要特殊的芯片和设备,其成本较高,且对低丰度的低序列核酸鉴别准确性不高,高通量测序对于低丰度的低序列核酸难以完全检测出,故对低丰度的低序列核酸鉴别准确性不高,而实时定量pcr无法同时检测多个基因或核酸片段,且当感染样本中存在未知寄生菌种时,难以单独使用此种方法。
技术实现思路
1、本发明提供一种低序列数核酸鉴别方法及系统,其主要目的在于实现低序列数核酸鉴别并提高低序列数核酸鉴别的准确性。
2、为实现上述目的,本发明提供的一种低序列数核酸鉴别方法,包括:
3、获取感染标本,对感染标本进行预处理,得到混合样本,对混合样本执行测序,得到一种或多种寄生菌种序列及宿主序列,从所述一种或多种寄生菌种序列中依次提取寄生菌种序列,并对所提取的寄生菌种序列均执行如下操作:
4、基于混合样本获取多个单位检测样本,从所述多个单位检测样本中依次提取单位检测样本,并对所提取的单位检测样本均执行如下操作:
5、基于所提取的寄生菌种序列获取寄生菌种序列个数,基于混合样本获取宿主序列个数,利用宿主序列个数及寄生菌种序列个数获取初始比值;
6、汇总多个初始比值,得到初始比值集,基于初始比值集获取所提取的寄生菌种序列的初始比值均值;
7、从预构建的标准寄生菌种序列库中依次提取标准寄生菌种,基于所提取的标准寄生菌种获取标准比值集,利用预构建的鉴别指数计算公式、标准比值集及初始比值均值计算鉴别指数;
8、汇总多个鉴别指数,得到鉴别指数集,基于所述鉴别指数集获取初始核酸类别集,其中,所述初始核酸类别集中包括一个或多个初始核酸类别;
9、利用预构建的核酸扩增技术及初始核酸类别集确定所提取的寄生菌种序列对应的寄生核酸类别,完成低序列核酸鉴别。
10、可选地,所述获取感染标本,对感染标本进行预处理,得到混合样本,包括:
11、基于所述感染标本获取三份单位标本,得到第一单位标本、第二单位标本及第三单位标本;
12、基于预设的宿主dna去除比例对第一单位标本进行第一去宿主处理,得到第一样本,根据宿主dn a去除比例分别对第二单位标本进行第二去宿主处理且对第三单位标本进行第三去宿主处理,得到第二样本及第三样本,其中,所述第一去宿主处理、第二去宿主处理及第三去宿主处理为三种不同的去宿主处理方法;
13、基于第一样本、第二样本及第三样本获取混合样本。
14、可选地,所述基于初始比值集获取所提取的寄生菌种序列的初始比值均值,包括:
15、所述初始比值的计算公式为:
16、
17、其中,xi表示序号为i的单位检测样本的初始比值,i表示所提取的单位检测样本的序号,ai表示序号为i的单位检测样本的寄生菌种序列个数,bi表示序号为i的单位检测样本的宿主序列个数;
18、所述初始比值均值的计算公式为:
19、
20、其中,p为所述初始比值均值,n为所述初始比值集中的初始比值的总数量。
21、可选地,所述从预构建标准寄生菌种序列库中依次提取标准寄生菌种,包括:
22、获取多个标准寄生菌种,从所述多个标准寄生菌种中依次提取标准寄生菌种,并对所提取的标准寄生菌种均执行如下操作:
23、基于标准寄生菌种获取多个标准感染样本,从所述多个标准感染样本中依次提取标准感染样本,并对所提取的标准感染样本均执行如下操作:
24、基于所述标准感染样本获取标准寄生菌种序列个数、标准宿主序列个数、宿主信息及寄生菌种信息,根据所述标准寄生菌种序列个数及标准宿主序列个数计算初始标准比值,汇总多个初始标准比值,得到初始标准比值集;
25、基于所述宿主信息获取初始标准比值集中的异常值,剔除所述初始标准比值集中的异常值,得到第一优化集,根据所述第一优化集获取优化均值及优化标准差,基于所述优化均值及优化标准差筛选所述第一优化集,得到标准比值集;
26、基于所述标准比值集构建标准寄生菌种对应的标准比值库;
27、汇总所述多个标准寄生菌种中的每一个标准寄生菌种对应的标准比值库,得到标准寄生菌种序列库;
28、从标准寄生菌种序列库中依次提取标准寄生菌种。
29、可选地,所述基于所提取的标准寄生菌种获取标准比值集,利用预构建的鉴别指数计算公式、标准比值集及初始比值均值计算鉴别指数,包括:
30、构建鉴别指数计算公式,基于标准比值集获取标准均值,基于鉴别指数计算公式、标准比值集及初始比值均值计算鉴别指数,其中,所述鉴别指数计算公式为:
31、
32、其中,v表示鉴别指数,x表示所述标准均值。
33、可选地,所述基于所述鉴别指数集获取初始核酸类别集,包括:
34、利用预设的鉴别阈值筛选所提取的鉴别指数集,得到优化指数集;
35、从所述优化指数集中依次提取优化指数,基于所提取的优化指数将所述优化指数集中的优化指数按数值递减排列,得到递减指数集;
36、从所述递减指数集中依次提取递减指数,基于所提取的递减指数获取所提取的递减指数对应的标准寄生菌种;
37、基于所述标准寄生菌种获取标准菌种集,其中,所述标准寄生菌种集中包括一个或多个标准寄生菌种;
38、基于所述标准菌种集获取初始核酸类别集。
39、可选地,所述利用预设的鉴别阈值筛选所提取的鉴别指数集,得到优化指数集,包括:
40、从所述鉴别指数集中依次提取鉴别指数,并比较所提取的鉴别指数与鉴别阈值的大小;
41、若所述鉴别指数大于鉴别阈值,则确认所述鉴别指数为优化指数;
42、若所述鉴别指数小于鉴别阈值,则剔除所述鉴别指数;
43、汇总多个优化指数,得到优化指数集。
44、可选地,所述鉴别阈值为50%。
45、可选地,所述利用预构建的核酸扩增技术及初始核酸类别集确定所提取的寄生菌种序列对应的寄生核酸类别,包括:
46、从所述初始核酸类别集中依次提取初始核酸类别,并对所提取的核酸类别均执行如下操作:
47、基于所提取的初始核酸类别获取所提取的初始核酸类别对应的扩增引物,利用预构建的核酸扩增技术、扩增引物及多个单位检测样本获取扩增后样本;
48、基于所述扩增后样本获取扩增后样本集,其中,所述扩增后样本集中包括一个或多个;
49、基于所述扩增后样本集获取所提取的寄生菌种序列对应的寄生核酸类别。
50、为了解决上述问题,本发明还提供一种低序列数核酸鉴别系统,所述系统包括:
51、初始比值均值获取模块,用于获取感染标本,对感染标本进行预处理,得到混合样本,对混合样本执行测序,得到一种或多种寄生菌种序列及宿主序列,从所述一种或多种寄生菌种序列中依次提取寄生菌种序列,并对所提取的寄生菌种序列均执行如下操作:基于混合样本获取多个单位检测样本,从所述多个单位检测样本中依次提取单位检测样本,并对所提取的单位检测样本均执行如下操作:基于所提取的寄生菌种序列获取寄生菌种序列个数,基于混合样本获取宿主序列个数,利用宿主序列个数及寄生菌种序列个数获取初始比值;汇总多个初始比值,得到初始比值集,基于初始比值集获取所提取的寄生菌种序列的初始比值均值;
52、菌类初鉴别模块,用于从预构建的标准寄生菌种序列库中依次提取标准寄生菌种,基于所提取的标准寄生菌种获取标准比值集,利用预构建的鉴别指数计算公式、标准比值集及初始比值均值计算鉴别指数;汇总多个鉴别指数,得到鉴别指数集,基于所述鉴别指数集获取初始核酸类别集,其中,所述初始核酸类别集中包括一个或多个初始核酸类别;
53、寄生核酸类别获取模块,用于利用预构建的核酸扩增技术及初始核酸类别集确定所提取的寄生菌种序列对应的寄生核酸类别,完成低序列核酸鉴别。
54、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
55、至少一种处理器;以及,
56、与所述至少一个处理器通信连接的存储器;其中,
57、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现上述所述的低序列数核酸鉴别方法。
58、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的低序列数核酸鉴别方法。
59、相比于背景技术所述问题,本发明实施例首先获取感染标本,对感染标本进行预处理,得到混合样本,本发明实施例在对感染标本进行预处理的过程中,使用了三种不同的去宿主处理方法,减小去宿主处理这一过程中由于方法选择造成的对感染标本中的寄生菌种的寄生菌种序列的影响,对混合样本执行测序,得到一种或多种寄生菌种序列及宿主序列,从所述一种或多种寄生菌种序列中依次提取寄生菌种序列,并对所提取的寄生菌种序列均执行如下操作:基于混合样本获取多个单位检测样本,从所述多个单位检测样本中依次提取单位检测样本,本发明实施例将混合样本拆分成多个单位检测样本并对每一个单位检测样本进行检测,减少由于测序过程中的操作不当导致的检出结果不准确的概率,并对所提取的单位检测样本均执行如下操作:基于所提取的寄生菌种序列获取寄生菌种序列个数,基于混合样本获取宿主序列个数,利用宿主序列个数及寄生菌种序列个数获取初始比值;汇总多个初始比值,得到初始比值集,基于初始比值集获取所提取的寄生菌种序列的初始比值均值,本发明实施例使得基于初始比值集获取的初始比值均值更具有代表性,从而减小在获取宿主序列个数及寄生菌种序列个数的过程中由于寄生菌种的低序列数造成的误差,从预构建标准寄生菌种序列库中依次提取标准寄生菌种,基于所提取的标准寄生菌种获取标准比值集,利用预构建的鉴别指数计算公式、标准比值集及初始比值均值计算鉴别指数,本发明实施例基于鉴别指数比对标准均值对应的标准寄生菌种与初始比值均值对应的从混合样本中提取的所提取的寄生菌种序列对应的寄生菌种之间的相似程度,且鉴别指数越大,说明标准寄生菌种与所提取的寄生菌种序列对应的寄生菌种为同一种寄生菌种的可能性越高,汇总多个鉴别指数,得到鉴别指数集,基于所述鉴别指数集获取初始核酸类别集,其中,所述初始核酸类别集中包括一个或多个初始核酸类别,本发明实施例充分考虑了基因之间的相似性造成的干扰,并对鉴别指数进行筛选,同时考虑了实验操作不当所带来的影响,同时还优先判断鉴别指数较大的标准寄生菌种是否为所提取的寄生菌种序列对应的寄生菌种,提高了验证效率,利用预构建的核酸扩增技术及初始核酸类别集确定所提取的寄生菌种序列对应的寄生核酸类别,完成低序列核酸鉴别,本发明实施例使用pc r扩增技术对所述混合样本中的寄生菌种进行再鉴别,提高了鉴别结果的准确性。与背景技术相比,通过对混合样本的预处理,提高了寄生菌种序列的占比,使得在后续的处理中提高了检测的准确性,同时对所提取的寄生菌种序列对应的寄生菌种利用标准寄生菌种序列库和鉴别指数进行筛选后,还使用pc r扩增技术进行再鉴别,解决了背景技术中低丰度难以检出、未知寄生菌种无法检出及无法同时检测多种寄生菌种等问题,进而提高了低序列数核酸鉴别的准确性。因此本发明提出的低序列数核酸鉴别方法、系统、电子设备及计算机可读存储介质,其主要目的在于实现低序列数核酸鉴别并提高低序列数核酸鉴别的准确性。
本文地址:https://www.jishuxx.com/zhuanli/20240614/88668.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表