一种HIV/AIDS患者生存预后模型及其构建方法与流程
- 国知局
- 2024-08-05 12:07:53
本发明涉及生物医学,具体为一种hiv/aids患者生存预后模型及其构建方法。
背景技术:
1、随着高效抗hiv逆转录病毒疗法(art)的普及,hiv/aids患者的生存预后得到了显著改善。art的有效性在于其能够抑制病毒复制,保持免疫系统的功能,显著延长患者寿命,提高生活质量。尽管治疗手段不断进步,每年仍有大量患者因aids及其相关并发症死亡。此外,hiv/aids患者比一般人群更易患有多种慢性疾病,这对于患者的长期健康管理提出了新的挑战。
2、尽管近年来art治疗显著提高了hiv/aids患者的预后,但现有的生存预后模型仍然面临着多方面的挑战。首先,许多现有模型在数据处理方面存在不足。由于hiv/aids患者的生存数据往往呈现出非均衡分布,即存活患者与死亡患者之间的比例差异很大,这导致传统模型在处理这种不平衡数据时容易偏向多数类,从而忽略对少数类别的预测,即对患者死亡风险的评估可能不够准确。
3、其次,现有预后模型多采用单一的统计方法或传统的机器学习算法构建,这些方法在处理高维度、非线性的临床数据时往往能力有限。现有方法可能无法充分发掘数据中的复杂关系和潜在模式,尤其是在处理具有时间依赖性的生存数据时,这种方法可能导致重要生物标记或临床特征的遗漏,限制了模型的预测性能和解释性。
4、因此,针对现有技术的这些问题,迫切需要开发一种h iv/aids患者生存新的预后模型。
技术实现思路
1、针对现有技术的不足,本发明提供了一种h iv/aids患者生存预后模型及其构建方法,采用了随机生存森林这种机器学习方法与cox回归模型这种传统方法相比较的建模方法,最终应用机器学习处理高维数据,构建更优预测模型。
2、为实现以上目的,本发明通过以下技术方案予以实现:一种h iv/aids患者生存预后模型的构建方法,包括以下步骤:
3、收集患者的人口学信息、临床特征和常规血液生化指标;
4、对收集的样本信息使用过采样和欠采样方法进行采样平衡;
5、使用随机生存森林方法分析数据并识别出独立预后因素,并建立随机生存森林模型;
6、使用cox回归模型对单因素cox分析得到的独立预后因素进行分析,构建cox回归模型,同时比较随机生存森林模型与cox回归模型在多项指标的优劣,选出最优模型,即随机生存森林模型。
7、优选的,所述人口学信息包括患者的年龄、性别、婚姻状态、文化程度和bm i。
8、优选的,所述临床特征包括h iv感染途径、性病史、h iv疾病的who临床分级、疾病阶段、结核、首次用药方案和是否换药。
9、优选的,所述常规血液生化指标包括首次cd4检测值、病毒载量、白细胞计数、血小板、血红蛋白、血肌酐、血糖、alt和总胆红素。
10、优选的,过采样与欠采样结合的采样方式通过复制少数类样本来增加其数量。同时,通过删除多数类样本来减少其数量。通过这种方式,该函数调整了数据集中各类别样本的分布,使得样本在不同类别上的数量更加平衡,从而有助于提升模型在类别不平衡数据集上的性能表现。
11、优选的,所述使用随机生存森林方法分析数据并识别出独立预后因素步骤包括计算每棵树的累积风险函数,并得到集成累积风险函数的均值。
12、优选的,所述使用cox回归模型对单因素cox分析得到的独立预后因素进行分析,构建预后模型步骤,包括使用逐步方法从单因素cox分析得到的独立预后因素中选择最终的预后因素,同时比较所建立c0x模型与随机生存森林模型在各项性能的优劣,最后选出随机生存森林模型作为最终模型。。
13、本发明还提供一种由所述的构建方法构建的h iv/aids患者生存预后模型。
14、本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述的方法。
15、本发明还提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的方法。
16、本发明提供了一种hiv/aids患者生存预后模型及其构建方法。具备以下有益效果:
17、本发明采用了机器学习与传统模型相比较的方法,进一步发现机器学习在处理数据的优势。最终建立的随机生存森林模型结合了多棵决策树的预测结果,通过集成学习提高了模型的预测准确性,相比传统的单一型,该方法能够更准确地预测艾滋病患者的存活情况。
技术特征:1.一种hiv/aids患者生存预后模型的构建方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种hiv/aids患者生存预后模型的构建方法,其特征在于,所述人口学信息包括患者的年龄、性别、婚姻状态、文化程度和bmi。
3.根据权利要求1所述的一种hiv/aids患者生存预后模型的构建方法,其特征在于,所述临床特征包括hiv感染途径、性病史、hiv疾病的who临床分级、疾病阶段、结核、首次用药方案和是否换药。
4.根据权利要求1所述的一种hiv/aids患者生存预后模型的构建方法,其特征在于,所述常规血液生化指标包括首次cd4检测值、病毒载量、白细胞计数、血小板、血红蛋白、血肌酐、甘油三酯、总胆固醇、血糖、alt和总胆红素。
5.根据权利要求1所述的一种hiv/aids患者生存预后模型的构建方法,其特征在于,所述过采样与欠采样结合的采样方式通过复制少数类样本来增加其数量,同时,通过删除多数类样本来减少其数量,通过这种方式,该函数调整了数据集中各类别样本的分布,使得样本在不同类别上的数量更加平衡,从而有助于提升模型在类别不平衡数据集上的性能表现。
6.根据权利要求1所述的一种hiv/aids患者生存预后模型的构建方法,其特征在于,所述使用随机生存森林方法分析数据并识别出独立预后因素步骤包括计算每棵树的累积风险函数,并得到集成累积风险函数的均值,并采用自举重100次重采样获得重要性排名前列的因素建立最终模型。
7.根据权利要求1所述的一种hiv/aids患者生存预后模型的构建方法,其特征在于,所述使用cox回归模型对单因素cox得到的独立预后因素进行分析,构建预后模型步骤,包括使用逐步方法从单因素cox分析得到的独立预后因素中选择最终的预后因素,同时比较所建立cox模型与随机生存森林模型在各项性能的优劣,最后选出随机生存森林模型作为最终模型。
8.一种由权利要求1-7任一项所述的构建方法构建的hiv/aids患者生存预后模型。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-7任一项所述的方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7任一项所述的方法。
技术总结本申请涉及生物医学领域,公开了一种HIV/AIDS患者生存预后模型及其构建方法,包括以下步骤:S1、收集患者的人口学信息、临床特征和常规血液生化指标;S2、对收集的样本信息使用过采样与欠采样相结合方法进行采样平衡;S3、使用随机生存森林方法和Cox方法分析数据并识别出独立预后因素;S4、比较随机生存森林和Cox模型在多项性能指标的优劣,选出最优模型。本发明采用了机器学习与传统模型相比较的方法,进一步发现机器学习在处理数据的优势。最终建立的随机生存森林模型结合了多棵决策树的预测结果,通过集成学习提高了模型的预测准确性,相比传统的单一模型,该方法能够更准确地预测艾滋病患者的存活情况。技术研发人员:李小杉,卫艺璇,王威,李妍慧,李志杰,叶雨秀受保护的技术使用者:无锡市人民医院技术研发日:技术公布日:2024/8/1本文地址:https://www.jishuxx.com/zhuanli/20240802/261200.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表