技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 一种用于突变位点自动化审核的方法及装置与流程  >  正文

一种用于突变位点自动化审核的方法及装置与流程

  • 国知局
  • 2024-07-12 10:23:37

本发明涉及生物信息处理领域,具体地涉及一种用于突变位点自动化审核的方法及装置。

背景技术:

1、临床样本ngs分析时,为避免过滤掉有意义的阳性突变,造成漏检,突变检测软件(如freebayes、vardict、varscan、mutect2)通常会放宽检测的阈值,扩大检测到的突变数量。突变检测质控阈值放宽会引入假阳性的突变,但放大假阳性率在临床也是不能容忍的,因此软件自动检测完后,还有大量的突变位点需要人工检验。

2、人工审核具有以下的局限性:①不同人因为经验等方面的差异,审核相同的样本,也常常会出现不一致的结果,容易出现主观性误判。②审核人员培训成本较大,培养专业的审核人员,费时费力。③人工审核的效率较低,尤其加急样本较多时,审核人工作负担大,造成极大的人力成本。

3、因此,目前仍需要开发一种突变位点自动化审核方法及装置,以避免临床样本ngs分析中检出假阳性检测位点的问题,从而实现快速、准确、一致性的位点审核。

技术实现思路

1、为解决现有技术中的至少部分问题,本发明提供一种突变位点自动化审核方法及装置。本发明的方法准确性高,不依赖审核人的主观判断,并且保证了审核的一致性,同时审核效率高,每个月节省人时近100小时,并且节省了培训成本。具体地,本发明包括以下内容。

2、本发明的第一方面,提供一种用于突变位点自动化审核的方法,其包括以下步骤:

3、(1)获取测序读段作为待审核位点;

4、(2)判定支持突变的测序读段是否是高质量的测序读段;

5、(3)判定突变位点的真假。

6、在某些实施方案中,根据本发明所述的用于突变位点自动化审核的方法,其中,当需要对体细胞突变真假进行判定时,所述方法还包括:(4)判定所述突变位点在肿瘤对照样本中是否为真。

7、本领域知道如何获取测序读段作为待审核位点,例如通过测序仪或测序平台中得到的测序数据或测序读段作为待审核位点。

8、在某些实施方案中,根据本发明所述的用于突变位点自动化审核的方法,其中,步骤(2)中,根据以下指标判定支持突变的测序读段是否是高质量的测序读段:

9、a.测序读段的比对质量;

10、b.突变是否位于测序读段的末端;

11、c.测序读段上核苷酸编辑的长度,包括核苷酸的替换、插入和/或缺失;

12、d.测序读段上支持突变的碱基质量。

13、在某些实施方案中,根据本发明所述的用于突变位点自动化审核的方法,其中,步骤(2)中,当测序读段的比对质量的分值高于30、测序读段上支持突变的碱基质量高于20、突变距离测序读段末端高于5bp、测序读段上核苷酸编辑长度小于3时,判定支持突变的测序读段为高质量的测序读段。

14、在某些实施方案中,根据本发明所述的用于突变位点自动化审核的方法,其中,步骤(3)中,根据以下指标判定突变位点的真假:

15、i.支持突变的高质量测序读段是否存在偏好,其中采用正负测序读段的数量的比值来计算;

16、ii.突变是否位于基因组的重复区域;

17、iii.高质量的测序读段的数量是否超过阈值。

18、在某些实施方案中,根据本发明所述的用于突变位点自动化审核的方法,其中,步骤(3)中,当高质量的测序读段正负链比值小于10、突变不位于重复区域、高质量的测序读段的数量大于等于3条时,判定突变位点为真。

19、在某些实施方案中,根据本发明所述的用于突变位点自动化审核的方法,其中,当判定是否为阳性体细胞突变时,进一步包括判定在肿瘤对照样本中位点是否为假,且当高质量的测序读段正负链比值小于10、突变不位于重复区域、高质量的测序读段的数量大于等于3条时,判定突变位点为假时,判定该突变位点为阳性体细胞突变。

20、本发明的第二方面,提供一种用于突变位点自动化审核的装置,其包括:

21、待审核位点获取单元,其用于获取测序读段作为待审核位点;

22、高质量的测序读段判定单元,其用于根据选择的第一指标和对应的阈值判定支持突变的测序读段是否是高质量的测序读段;

23、突变位点的真假判定单元,其用于根据选择的第二指标和对应的阈值判定突变位点的真假;

24、优选地,所述第一指标包括:

25、a.测序读段的比对质量;

26、b.突变是否位于测序读段的末端;

27、c.测序读段上核苷酸编辑的长度,包括核苷酸的替换、插入和/或缺失;

28、d.测序读段上支持突变的碱基质量;

29、优选地,所述第二指标包括:

30、i.支持突变的高质量测序读段是否存在偏好,其中采用正负测序读段的数量的比值来计算;

31、ii.突变是否位于基因组的重复区域;

32、iii.高质量的测序读段的数量是否超过阈值;

33、优选地,所述第二指标还包括判定所述突变位点在肿瘤对照样本中是否为真。

34、本发明的第三方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面所述的方法。

35、本发明的第四方面,提供一种计算机存储介质,其存储有计算机程序,所述计算机程序被计算机执行时实现第一方面所述的方法。

36、本发明通过定位突变位点,获取支持突变的reads比对质量、支持突变总reads条数、支持突变的碱基是否位于reads的末端、支持突变的reads上存在的突变数是否超过阈值、支持突变的reads正负链是否均衡以及突变是否位于基因组重复区域,通过整合以上信息综合判读位点真假。另外,对于体细胞突变,还增加了是否为胚系突变的判定。

37、本发明避免了一些突变检测软件会检测出一些假阳性突变而需要通过审核人员使用igv integrative genomics viewer工具进行人工检验来排除程序检测出的假阳性位点的问题,解决了由于人工检验容易出现人为误判、主观性依赖以及效率较低的问题,因此本发明使用python程序实现突变位点的快速、准确且一致性的审核。

技术特征:

1.一种用于突变位点自动化审核的方法,其特征在于,其包括以下步骤:

2.根据权利要求1所述的用于突变位点自动化审核的方法,其特征在于,当需要对体细胞突变真假进行判定时,所述方法还包括:(4)判定所述突变位点在肿瘤对照样本中是否为真。

3.根据权利要求1或2所述的用于突变位点自动化审核的方法,其特征在于,步骤(2)中,根据以下指标判定支持突变的测序读段是否是高质量的测序读段:

4.根据权利要求3所述的用于突变位点自动化审核的方法,其特征在于,步骤(2)中,当测序读段的比对质量的分值高于30、测序读段上支持突变的碱基质量高于20、突变距离测序读段末端高于5bp、测序读段上核苷酸编辑长度小于3时,判定支持突变的测序读段为高质量的测序读段。

5.根据权利要求1或2所述的用于突变位点自动化审核的方法,其特征在于,步骤(3)中,根据以下指标判定突变位点的真假:

6.根据权利要求5所述的用于突变位点自动化审核的方法,其特征在于,步骤(3)中,当高质量的测序读段正负链比值小于10、突变不位于重复区域、高质量的测序读段的数量大于等于3条时,判定突变位点为真。

7.根据权利要求6所述的用于突变位点自动化审核的方法,其特征在于,当判定是否为阳性体细胞突变时,进一步包括判定在肿瘤对照样本中位点是否为假,且当高质量的测序读段正负链比值小于10、突变不位于重复区域、高质量的测序读段的数量大于等于3条时,判定突变位点为假时,判定该突变位点为阳性体细胞突变。

8.一种用于突变位点自动化审核的装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7任一项所述的方法。

10.一种计算机存储介质,其特征在于,其存储有计算机程序,所述计算机程序被计算机执行时实现权利要求1-7任一项所述的方法。

技术总结本发明公开一种用于突变位点自动化审核的方法及装置。该方法包括:(1)获取测序读段作为待审核位点;(2)判定支持突变的测序读段是否是高质量的测序读段;(3)判定突变位点的真假。本发明的方法准确性高,不依赖审核人的主观判断,并且保证了审核的一致性,同时审核效率高,每个月节省人时近100小时,并且节省了培训成本。本发明解决了由于人工检验容易出现人为误判、主观性依赖以及效率较低的问题,因此本发明实现了突变位点的快速、准确且一致性的审核。技术研发人员:李致伟,辛瑶,张美俊,封彦杰,赵玥,田埂受保护的技术使用者:元码基因科技(北京)股份有限公司技术研发日:技术公布日:2024/6/11

本文地址:https://www.jishuxx.com/zhuanli/20240614/86652.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。