一种基于高通量测序的肿瘤单样本体细胞突变判别及单样本肿瘤突变负荷检测方法与流程
- 国知局
- 2024-11-19 09:45:53
本发明属于生物信息学及高通量测序,具体涉及一种基于高通量测序的肿瘤单样本体细胞突变判别及单样本肿瘤突变负荷检测方法。
背景技术:
1、人类个体从受精卵发育而来,受精卵中的突变称为胚系突变,主要来源于父母双方的遗传。个体成长发育后,因为外界众多因素刺激导致自身细胞中发生了新突变,这些突变称为体细胞突变。体细胞突变根据危害性可分为乘客突变和驱动突变。乘客突变大部分是良性突变,不影响基因功能、蛋白结构等,少部分会通过信号通路、调控元件等导致良性肿瘤,在一定环境因素影响下继而引发驱动突变,导致良性肿瘤向恶性肿瘤即癌症的转变。驱动突变基本位于个体生长、个体发育、dna修复等重要基因上,且驱动突变会导致正常细胞的生长、分裂、形态、功能等异常,从而驱动正常细胞向癌细胞的转化。
2、癌症约有1000多种,近几年来,免疫治疗在众多癌症中表现出较好的临床效果。肿瘤突变负荷(tumor mutation burden,tmb)作为免疫治疗的标志物之一,被定义为每百万碱基中被检测出的体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数,tmb的数值根据阈值可判断为tmb-h(tmb high)和tmb-l(tmb low),其中免疫治疗对tmb-h的患者效果可能更好。
3、目前tmb的检测方法需要同一患者的肿瘤样本和正常对照样本一起进行二代测序,然后从肿瘤样本中去除对照样本检测到的突变,从而获得体细胞突变,进而计算tmb值。然而因为某些癌症的患者癌旁对照样本难取得、对照样本保存不当、患者原因、对照样本取法等因素,导致需要成对样本进行tmb检测的方法难以进行。
技术实现思路
1、本发明的目的一种基于高通量测序的肿瘤单样本体细胞突变判别及单样本肿瘤突变负荷检测方法,所述方法可以实现单肿瘤样本的肿瘤突变负荷的检测。
2、本发明提供了一种基于高通量测序的肿瘤单样本体细胞突变的判别方法,包括如下步骤:
3、基于正常群体样本高通量测序数据构建正常群体数据库,所述正常群体数据库包括正常群体snp信息数据库、正常群体胚系突变数据库和正常群体捕获区域内深度数据;
4、对肿瘤样本进行外显子捕获测序和质控,将质控后的肿瘤样本测序数据与人类参考基因组进行比对和过滤,得到肿瘤样本bam文件;
5、基于所述肿瘤样本bam文件进行snp分析和深度捕获分析,分别获得肿瘤样本snp位点和肿瘤样本捕获区域深度数据;
6、基于所述肿瘤样本snp位点、肿瘤样本捕获区域深度数据、正常群体snp信息数据库和正常群体捕获区域内深度数据计算肿瘤单样本纯度;
7、基于所述肿瘤样本bam文件进行突变检测,得到肿瘤样本突变vcf文件;
8、对所述肿瘤样本突变vcf文件进行正常群体胚系突变数据库筛选、人类公共数据库筛选和假阳性突变特征筛选,得到体细胞突变结果;
9、基于所述肿瘤单样本纯度、人群频率和肿瘤样本捕获区域深度数据对所述体细胞突变结果进行过滤,得到的体细胞突变数据。
10、优选的,所述构建正常群体数据库包括:对正常群体样本进行外显子捕获测序和质控,将质控后的正常群体样本测序数据与人类参考基因组进行比对和过滤,得到正常群体样本bam文件;
11、基于所述正常群体样本bam文件进行snp分析和深度捕获分析,分别获得正常群体样本snp信息数据库和正常群体捕获区域内深度数据;
12、基于所述正常群体样本bam文件进行变异检测,得到正常群体胚系突变数据库。
13、优选的,所述正常群体胚系突变数据库筛选包括:在所述肿瘤样本突变vcf文件的基础上,过滤去除所述正常群体胚系突变数据库中的胚系突变,得到去除胚系突变的正常群体胚系突变数据。
14、优选的,所述人类公共数据库筛选包括:在所述去除胚系突变的正常群体胚系突变数据的基础上,去除gnomad数据库外显子测序数据中人群频率大于1%的突变位点,去除dbsnp数据库中标注为“common”的突变位点和去除clinvar数据库中标注为“germline”来源的突变位点。
15、优选的,在所述人类公共数据库筛选后,所述假阳性突变特征筛选包括如下多项中至少一项:
16、去除位于人类白细胞抗原基因的突变;
17、去除同一个基因组位置位点的多个不同基因型突变;
18、去除reads支持数小于5,且位点总深度小于20的突变;
19、去除位于单碱基、三碱基重复区域且突变频率低于5%的突变,去除位于二碱基重复区域且突变频率低于4%的突变,去除位于四碱基重复区域且突变频率低于3%的突变;
20、去除突变位点位于左右10bp位于softclip区域的reads占总突变reads 20%以上的突变;
21、去除比对质量低于10的低比对质量的突变reads占总突变reads 50%以上的突变;
22、去除突变位点位于reads边缘左右10bp的reads占总突变reads 50%以上的突变;
23、去除氧化损伤和dna损伤且突变频率小于3%非热点突变和突变频率小于2%的热点突变;
24、去除突变reads中正链和负链reads比值大于9的的突变。
25、优选的,所述肿瘤单样本纯度的获得包括如下步骤:
26、在所述正常群体snp信息数据库中,统计检测到的每个位点ref和alt的reads支持数并求和,将求和后的总reads数除以正常群体样本总数,得到正常群体总体snp信息;
27、统计正常群体样本在所述正常群体捕获区域的100bp滑窗内的深度均值,得到正常群体捕获区域内深度均值;
28、将与所述肿瘤样本snp位点具有相同位置的所述正常群体总体snp信息中的snp位点补充至所述肿瘤样本snp位点中,得到补充后的肿瘤样本snp位点;
29、将与所述肿瘤样本捕获区域的100bp滑窗相同位置的所述正常群体总体深度均值补充至所述肿瘤样本捕获区域的100bp滑窗中,得到补充后的肿瘤样本深度信息;
30、依据所述补充后的肿瘤样本snp位点和补充后的肿瘤样本深度信息使用scarhrd软件分析,依据突变位点对应的拷贝数变异状态分布,得到所述肿瘤样本纯度。
31、优选的,所述正常群体样本包括正常人组织样本、正常人血液细胞样本、肿瘤患者血液细胞样本和肿瘤患者癌旁样本中的一种或多种。
32、优选的,所述人类参考基因组的版本包括hg19基因组。
33、本发明还提供了一种单样本肿瘤突变负荷评估模型的构建方法,基于上述技术方案所述的判别方法获得体细胞突变数据和外显子捕获测序捕获区域,按照预定的公式(1)进行肿瘤突变负荷的计算:
34、tmb=mut/panel size,公式(1);
35、其中,mut指纳入所述体细胞突变数据中体细胞突变的数目,panel size指的是外显子捕获测序捕获区域的大小,单位mb。
36、本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现上述技术方案所述方法的步骤。
37、本发明还提供了一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现上述技术方案所述方法的步骤。
38、本发明还提供了上述技术方案所述的方法、上述技术方案所述的计算机可读存储介质或上述技术方案所述的计算机程序产品在制备指导肿瘤免疫治疗用药的产品中的应用。
39、有益效果:
40、本发明提供了一种基于高通量测序的肿瘤单样本体细胞突变的判别方法,在此基础上,本发明还提供了单样本肿瘤突变负荷(tmb)评估模型的构建方法,本发明先通过正常群体样本高通量测序数据构建必需数据库,联合若干已知公共数据库及常见假阳性位点特征,对单肿瘤样本的高通量测序数据进行分析,区分出体细胞突变,最后计算tmb数值,以达到肿瘤单样本体细胞突变判别和检测tmb的目的。对于无法取得对照样本的单肿瘤数据也可计算tmb值,克服了现有技术中必须使用成对样本进行tmb值检测的技术问题,对于判断患者是否适合免疫治疗提供一定的证据基础。
本文地址:https://www.jishuxx.com/zhuanli/20241118/330121.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表