技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 用于揭示肺癌亚型TP53突变所引起的不同组学之间内在联系的方法  >  正文

用于揭示肺癌亚型TP53突变所引起的不同组学之间内在联系的方法

  • 国知局
  • 2024-07-12 10:26:13

本发明涉及生物信息,具体涉及用于揭示肺癌亚型tp53突变所引起的不同组学之间内在联系的方法。

背景技术:

1、根据2020年全球癌症统计数据,肺癌发病率位居全球第二(11.4%),仅次于乳腺癌(11.7%)。此外,肺癌是全球死亡率最高的疾病(18%),其次是结直肠癌(9.4%)。非小细胞肺癌是最普遍的肺癌类型,占所有肺癌病例的83%。与非小细胞肺癌发生发展相关的基因很多,其中tp53可能是比较重要的一个。

2、tp53位于17p染色体上,编码p53。当p53发生突变时,它会失去对细胞生长、细胞凋亡和dna修复机制的常规控制,从而促进肿瘤的发生和生长。大约80%的tp53突变是错义突变,其余包括移码、截断和缺失。

3、目前的研究指出,tp53基因的突变状态与非小细胞肺癌免疫治疗的总生存获益相关。另外,对于肺鳞状细胞癌(lusc,也即肺鳞癌)患者的研究发现,与非复发组和非转移组相比,复发组和转移组的细菌群落丰富度较低。同时,研究还发现了tp53基因与肺部菌群失调之间存在潜在的关联。此外,不同类型的肿瘤具有不同的肿瘤微环境组成,但通常包括免疫细胞、基质细胞、血管和细胞外基质等关键元素。尤其是免疫细胞,它们构成了肿瘤微环境中的另一个显著元素,包括粒细胞、淋巴细胞和巨噬细胞等。这些细胞参与多种免疫应答和活动,包括支持肿瘤存活的炎症反应的协调。与tp53错义突变和野生型tp53患者相比,有研究发现tp53无义突变的肺腺癌(luad)患者中肿瘤相关的m2巨噬细胞和中性粒细胞更为丰富。在组织病理图像方面,一些研究者采用深度学习方法,根据肺腺癌、肺鳞癌和正常肺组织的组织病理学图像进行准确分类。他们还成功进行了对肺腺癌的tp53突变预测,实现了0.76的曲线下面积(auc)。此外,还有研究指出,任何实体瘤的基因型决定了其表型,并提出了一种基于组织病理学图像的泛癌自监督注意力深度学习突变预测方法,对tp53的突变预测取得了约0.77的auc值。

4、总的来说,目前的研究从微生物群落、肿瘤免疫微环境和组织病理学图像等多个角度和学科研究了nsclc中的tp53突变。然而,组织微生物群、肿瘤免疫微环境和组织病理学图像之间的关联仍有待探索。为此,提出了用于揭示肺癌亚型tp53突变所引起的不同组学之间内在联系的方法。

技术实现思路

1、本发明所要解决的技术问题在于:如何通过计算统计方法和深度学习模型,将非小细胞肺癌中的tp53突变与组织微生物群落、免疫微环境以及组织病理图像之间的潜在关联进行挖掘,提供了用于揭示肺癌亚型tp53突变所引起的不同组学之间内在联系的方法。

2、如图6所示,本发明是通过以下技术方案解决上述技术问题的,本发明包括以下步骤:

3、s1:对tp53突变组与野生组在组织微生物上进行差异分析

4、对肺腺癌、肺鳞癌的tp53突变组和野生组在瘤内微生物群落进行α、β多样性分析,即分析是否存在差异,之后再通过lefse分析具体存在的差异的细菌微生物;

5、s2:对tp53分组在免疫细胞成分上进行差异分析以及对免疫细胞与微生物群落进行相关性分析

6、通过cibersort算法来计算步骤s1中两种肺癌亚型在免疫微环境中22种不同免疫细胞的占比,然后分析非小细胞肺癌的tp53分组在免疫细胞上是否存在差异,再将得到的差异的免疫细胞与步骤s1中差异的细菌微生物做spearman相关性分析;

7、s3:对两种肺癌亚型中tp53突变组与野生组在病理图像特征上进行差异分析以及对病理图像特征与免疫细胞进行相关性分析

8、对组织病理图像进行处理变换,再通过hu矩算法提取图像特征,将提取得到的肺癌亚型病理图像特征进行tp53分组并做差异分析,然后将病理图像特征与步骤s2中差异的免疫细胞做相关性分析;

9、s4:基于多模态深度学习方法来预测tp53突变并验证不同组学之间的关联

10、构建多模态深度学习模型来预测tp53突变,利用步骤s1~s3中所用到的多组学数据输入模型中共同训练,并通过模型验证不同组学之间的内在联系;

11、s5:不同组学之间的联系以及模型的可视化

12、利用步骤s1~s3的分析结果绘制多个微生物-免疫细胞-病理图像轴并进行可视化展示,应用grad-cam算法进行对模型关注区域进行可视化展示。

13、更进一步地,在所述步骤s1中,具体处理过程如下:

14、s11:分别在肺腺癌、肺鳞癌的tp53分组上做属水平细菌微生物的α多样性分析,计算在三种丰富度指数上是否存在差异;

15、s12:计算微生物群落在tp53突变组和野生组的β多样性分析,并通过adonis检验肺腺癌、肺鳞癌tp53分组是否存在差异;

16、s13:利用lefse分析肺腺癌具体的属水平细菌在tp53分组上的差异,得到差异的属水平细菌丰度数据。

17、更进一步地,在所述步骤s1中,α多样性指数包括三种丰富度指数具体如下:

18、shannon指数:

19、

20、simpson指数:

21、

22、pielou指数:

23、

24、其中,pi是第i个物种的相对丰度,s是物种数,h‘是shannon多样性指数。

25、更进一步地,在所述步骤s2中,具体处理过程如下:

26、s21:输入mrna基因表达数据并利用cibersort算法计算出肺癌亚型22种免疫细胞相对丰度,再对免疫细胞做差异分析,输出wilcoxon秩和检验结果,即p值大小,当p值小于0.05时,则认为该细胞在tp53分组上存在差异,即可获得差异的免疫细胞;

27、s22:将步骤s21分析得到的差异的免疫细胞与步骤s13得到的差异的属水平细胞做spearman相关性分析。

28、更进一步地,在所述步骤s3中,具体处理过程如下:

29、s31:对组织病理图像进行下采样并获取缩略图,通过转换颜色通道,提取感兴趣区域,再通过hu矩算法提取病理图像特征;

30、s32:将步骤s31中提取的病理图像特征在tp53分组做差异分析,得到差异的图像特征;

31、s33:计算步骤s21中差异的免疫细胞相对丰度与步骤s31中提取的病理图像特征之间的spearman相关性。

32、更进一步地,在所述步骤s31中,通过生成二值掩码来分割组织区域,再执行形态学闭合操作以填充掩码上的间隙和孔洞,随后根据设置的区域阈值过滤已识别的前景对象的近似轮廓。

33、更进一步地,在所述步骤s4中,具体处理过程如下:

34、s41:多组学数据的预处理

35、从tcga公共数据集中筛选并匹配多个组学数据,对病理图像进行标注,切片成一系列512x512大小的组织病理图像并进行颜色归一化操作,其中,多个组学数据包括组织微生物数据、mrna基因表达数据、病理图像数据;

36、s42:构建多模态深度学习模型并选取损失函数

37、将切片后的组织病理图像输入至resnet18残差网络,将组织病理图像与微生物相对丰度表达谱以及mrna基因表达数据通过紧凑型双线性池化算法进行融合,设定tp53突变型作为标签1,tp53野生型为标签0,采用交叉熵损失作为模型的损失函数,其中多模态深度学习模型基于resnet18残差网络训练得到;

38、s43:设置模型超参数并进行训练

39、设置训练迭代次数、批处理大小、初始学习率,对resnet18残差网络进行训练,训练后模型进行验证,最后保存模型与模型输出文件。

40、更进一步地,在所述步骤s42中,假设有两个模态的特征向量,分别为a∈rm和b∈rn,其中rm表示m维的实数空间,rn表示n维的实数空间,紧凑型双线性池化算法表示如下:

41、c=fft-1(fft(a)⊙fft(b))

42、其中,⊙表示逐元素相乘,fft表示快速傅立叶变换,fft-1表示傅立叶逆变换;

43、交叉熵损失定义如下:

44、

45、其中,y表示样本的标签,即0或1,表示样本预测的概率。

46、更进一步地,在所述步骤s43中,具体处理过程如下:

47、s431:训练迭代次数设置为50个epoch,批处理大小为128,初始学习率为0.001;

48、s432:通过对每个组织病理图像获得的概率进行平均,以得到相应的组织病理图像的分类结果;

49、s433:采用五折交叉验证,并通过对每折的auc值求平均来评价模型;

50、s434:训练完毕,保存模型与模型输出文件。

51、更进一步地,在所述步骤s5中,具体处理过程如下:

52、s51:根据步骤s1~s3的分析结果进行多条关联轴的绘制;

53、s52:利用grad-cam算法对模型进行可视化,即将模型关注区域以热图形式呈现在组织病理图像上,其中,grad-cam算法定义如下:

54、

55、其中,a表示特征层,k表示特征层a中第k个通道,c表示类别,ak代表特征层a中通道k的数据,表示对于ak的权重。

56、本发明相比现有技术具有以下优点:

57、(1)与其他研究不同的是,该发明不仅仅针对单一组学数据的分析,而且探寻不同组学之间的内在联系。

58、(2)提出了一个基于多组学相互关联的分析框架,不仅适用于tp53基因突变这一生物标志物,同样适用于其他生物标志物;

59、(3)提出了一个多模态深度学习模型,该模型同样不仅可以预测基因,也能预测其他生物标志物,同时,基于模型输出结果来验证不同组学之间的潜在关联。

本文地址:https://www.jishuxx.com/zhuanli/20240614/86915.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。