一种基于机器学习的肾母细胞瘤风险预测模型的构建方法
- 国知局
- 2024-07-12 10:20:00
本发明属于生物医学领域,具体涉及一种基于机器学习的肾母细胞瘤风险预测模型的构建方法。
背景技术:
1、肾母细胞瘤(wilms’tumor,wt)是最常见的小儿肾脏肿瘤,占儿童肾癌的95%,在0-4岁儿童中最常见。wt可发生在单侧肾脏,也可以发生在双侧肾脏,可呈散在性,也可呈多灶性。10%左右的wt患儿合并有相关的先天性缺陷综合征。双侧和多灶性肿瘤或具有先天性缺陷综合征的wt(中位诊断年龄2岁)发病时间早于散发性wt(中位诊断年龄3岁)。目前,wt的治疗手段主要有放疗、化疗和手术治疗。在国际儿童肿瘤协会(siop)和美国儿童肿瘤协作组(cog)的主导下,对综合治疗方案的不断探索和改进,使低危险组wt患儿5年生存率达到90%,但双侧、复发和高风险wt的治疗仍具有挑战性。wt的诊断主要依靠临床症状和影像学技术,然而,这些诊断工具只有在疾病发展到一定程度才会使用。早期准确诊断及时的治疗是提高wt患儿长期生存的关键。因此,进一步在分子水平上识别wt的分子亚型,建立wt的风险预测模型具有重要意义。
2、铜死亡是一种铜诱导的程序性细胞死亡的新形式,铜离子载体将过量的铜离子转运入细胞,铜离子结合硫辛酰化修饰蛋白使其寡聚化从而三羧酸循环受到影响。硫辛酰化修饰蛋白是细胞中重要代谢酶复合物的核心成分,调节碳进入三羧酸循环。另外,铜还可以降解fe-s簇蛋白,导致蛋白毒性应激和细胞死亡。目前,已有较多文献报道铜死亡相关基因(crgs)与多种肿瘤相关。例如,crgs可以预测肾透明细胞癌、胰腺癌、肝癌、胶质瘤、胃癌等患者的预后。然而,crgs在儿童实体肿瘤中的研究鲜有报导,仅在神经母细胞瘤(nb)中有相关报道。guang-hui wei等人对nb患儿中crgs的表达进行了全面分析,并鉴定了预后相关的铜死亡相关亚型,构建nb患儿的预后模型,并探索了crgs与肿瘤微环境之间的关系。最后,进行qpcr验证nb细胞系中风险基因的表达情况及沉默风险基因对nb细胞生物学功能的影响,为nb患儿的诊治提供了新的治疗靶点。但crgs在wt中的作用机制尚不清楚。
技术实现思路
1、本发明的目的在于克服现有技术的不足,提供一种基于机器学习的肾母细胞瘤风险预测模型的构建方法,该预测模型为未来的个性化诊断与治疗提供基础。
2、为实现上述目的,本发明采用的技术方案是:
3、一种基于机器学习的肾母细胞瘤风险预测模型的构建方法,包括以下步骤:
4、s1、获取训练集和验证集;
5、s2、将获得的多个铜死亡相关基因与步骤s1得到的训练集取交集得到铜死亡相关基因的表达矩阵,然后对铜死亡相关基因的表达矩阵进行差异表达分析,得到多个铜死亡差异表达基因;
6、s3、基于步骤s2得到的多个铜死亡差异表达基因,在k=2时,将肾母细胞瘤样本划分为分型1和分型2,并对多个铜死亡差异表达基因在分型1和分型2中的表达情况进行评估;
7、s4、建立正常组织与肾母细胞瘤的共表达网络和模块,得到肾母细胞瘤特征模块基因;
8、s5、根据步骤s3得到的分型1和分型2,建立分型1与分型2的共表达网络和模块,得到铜死亡特征模块基因;
9、s6、将步骤s4得到的肾母细胞瘤特征模块基因与步骤s5得到的铜死亡特征模块基因取交集,得到共同基因;
10、s7、基于步骤s6得到的共同基因,利用随机森林树(rf)、支持向量机(svm)、广义线性模型(glm)、极限梯度增强(xgb)这四种机器学习算法分别构建预测模型,并对上述各建立得到的预测模型的预测效果进行评估,根据评估结果,将svm预测模型作为肾母细胞瘤的预测模型,并通过步骤s1得到的验证集进行验证分析。
11、优选的,步骤s1包含以下步骤:
12、s11、将获取的gse66405、gse73209、gse2712和gse11024数据集进行合并,并去除批次效应,即得到训练集;
13、s12、对获取的target数据和gtex数据进行log2(x+1)标准化,并去去除批次效应,即得到验证集。
14、优选的,步骤s4包含以下步骤:
15、s41、使用“wgcna”r包选取最优软实力构建正常组织和肾母细胞瘤的加权邻接矩阵;
16、s42、将步骤s41得到的加权邻接矩阵转换为拓扑重叠矩阵;
17、s43、基于分层聚类算法,根据步骤s42得到的拓扑重叠矩阵得到不相似度量获得模块;
18、s44、根据步骤s43得到的不相似度量获得模块,得到肾母细胞瘤特征模块基因。
19、优选的,步骤s5包含以下步骤:
20、s51、根据步骤s3得到的分型1和分型2,使用“wgcna”r包选取最优软实力构建分型1和分型2的加权邻接矩阵;
21、s52、将步骤s51得到的加权邻接矩阵转换为拓扑重叠矩阵;
22、s53、基于分层聚类算法,根据步骤s52得到的拓扑重叠矩阵得到不相似度量获得模块;
23、s54、根据步骤s53得到的不相似度量获得模块,得到铜死亡特征模块基因。
24、本发明与现有技术相比,其有益效果在于:
25、(1)本发明揭示了肾母细胞瘤与铜死亡之间的相关性,为wt的风险预测构建有效的模型,并鉴定5个疾病特征基因,为未来wt的个性化诊断与治疗提供基础;
26、(2)本发明构建了一个基于5个基因的svm预测模型,校准曲线和决策曲线证明了该模型的准确性,并且在target-gtex验证数据集上表现出令人满意的性能;进一步分析发现,这5个基因在target-gtex验证数据集和测序数据上均呈高表达,说明svm预测模型能够有效地将wt与nt区分开来;
27、(3)本发明首次探索了crgs在wt中的表达差异,结果显示,共有13个crgs被鉴定为decrgs,包括nfe2l2、slc31a1、fdx1、lias、dld、dlat、pdha1、pdhb、mtf1、gls、cdkn2a、dbt、dlst,而这13个decrgs在wt中表达均低于nt组织。
技术特征:1.一种基于机器学习的肾母细胞瘤风险预测模型的构建方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于机器学习的肾母细胞瘤风险预测模型的构建方法,其特征在于,步骤s1包含以下步骤:
3.根据权利要求1所述的基于机器学习的肾母细胞瘤风险预测模型的构建方法,其特征在于,步骤s4包含以下步骤:
4.根据权利要求1所述的基于机器学习的肾母细胞瘤风险预测模型的构建方法,其特征在于,步骤s5包含以下步骤:
技术总结本发明公开了一种基于机器学习的肾母细胞瘤风险预测模型的构建方法,属于生物医学领域,通过从GEO数据库中获取四个WT基因表达谱,去除批次效应形成合并数据集,提取CRGs表达谱,并进行差异分析,基于105例WT样本,鉴定铜死亡相关亚型,使用加权基因共表达网络分析(WGCNA)鉴定疾病特征基因,并通过随机森林模型、支持向量机模型、广义线性模型和极限梯度强度模型等四种机器学习方法构建WT风险预测模型,本发明构建得到的预测模型在TARGET‑GTEx验证数据集上表现出令人满意的性能。技术研发人员:黄静茹,陈嘉波,王从军,陈鹏,蓝翊宁,韦佶秀,潘晓潭,郑茵受保护的技术使用者:广西医科大学第一附属医院技术研发日:技术公布日:2024/6/11本文地址:https://www.jishuxx.com/zhuanli/20240615/86268.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。