一种基于自监督深度学习诊断疾病的系统的制作方法
- 国知局
- 2024-10-21 14:37:52
本发明属于生物,具体地,涉及一种基于自监督深度学习诊断疾病的系统。
背景技术:
1、在医疗健康领域,疾病的准确和自动化诊断对于提升治疗速度、效果和患者生存率至关重要。传统诊断方法往往依赖于少量指标的检测结果和医生的经验,而这些方法可能受限于检测技术的局限性以及主观判断的差异性。与少量标志物相比,蛋白质组学能够同时分析数千种蛋白质,更全面的指标对疾病状态进行分析,提供更全面的疾病状态视图。这种多维度分析有助于发现疾病的复杂生物标志物组合,提高诊断的准确性。但是,海量的数据使得手动处理数据和综合分析变得不可能。人工智能系统能够快速处理和分析大规模数据集,相较于人力处理,其速度呈数量级提升。利用深度学习,人工智能系统能够自动发现数据中的隐藏关系和复杂模式,这些往往是人力难以察觉的,为决策提供了更深层次的见解。自监督学习是机器学习的一个分支,它通过利用数据本身的特征作为监督信号来进行训练,为疾病诊断提供了新的视角和工具。基于自监督深度学习诊断疾病是一种具有巨大潜力的解决方案。因此,能否设计出一种基于自监督深度学习诊断疾病的系统,对医疗健康领域具有重要的意义。
技术实现思路
1、发明目的:为解决现有技术存在的问题,本发明提供了一种基于自监督深度学习诊断疾病的系统。
2、技术方案:为达到上述发明目的,本发明采用如下技术方案:
3、一种基于自监督深度学习诊断疾病的系统,所述系统包括数据集合模块、数据转换模块、蛋白表达生成模块和疾病诊断模块;
4、所述数据集合模块,是收集质谱检测的待测者肽段水平的表达数据,形成数据集合;
5、所述数据转换模块,是将上述数据集合中的数据进行编码转换,构造一个自监督深度学习神经网络,对肽段水平的表达数据进行校正;
6、所述蛋白表达生成模块,是利用校正后的肽段水平的表达数据生成蛋白水平的表达数据;
7、所述疾病诊断模块,是利用蛋白水平的表达数据对待测者是否患病进行判定。
8、作为具体实施方案,所述待测者包括待诊断者、健康人和病人;所述待测者肽段水平的表达数据是通过质谱检测待测者的体液或组织所获得;所述数据集合为组学级别的数据。
9、作为具体实施方案,所述数据进行编码转换,是通过编码算法将肽段序列转换为编码,优选独热编码算法。
10、作为具体实施方案,所述自监督深度学习神经网络包括:输入层、卷积层、池化层、dropout层、全连接层、输出层;所述卷积层、池化层、dropout层、全连接层重复一次或多次;在重复多次的情况下,卷积层的输出连接下一次的池化层的输入,池化层的输出连接下一次的卷积层或dropout层的输入,全连接层的输出连接下一次的dropout层或输出层的输入。
11、作为具体实施方案,所述输入层输入编码后的肽段水平的表达数据;所述卷积层和池化层的组合进行特征提取;所述dropout层用于防止过拟合;所述全连接层进行特征整合;所述输出层对肽段水平的表达数据进行校正并输出。
12、作为具体实施方案,所述蛋白表达生成模块,通过整合算法,利用肽段水平的表达数据生成蛋白水平的表达数据,优选maxlfq算法。
13、作为具体实施方案,所述利用蛋白水平的表达数据对待测者是否患病进行判定,是采用无监督聚类算法进行判定;具体地,利用pca算法对蛋白水平的表达数据进行降维;对样本进行无监督聚类;通过对待诊断者与健康人和病人的距离关系,进行判定。
14、本发明还提供了一种计算机介质,上述系统整合在所述计算机介质中。
15、有益效果:
16、1.本发明利用蛋白组学级别数据,使用更全面的指标对疾病状态进行分析。
17、2.本发明综合使用大量指标,因此对多种复杂因素导致的疾病,相对于常规技术产生更好的效果。
18、3.本发明进行数据自动处理和分析,节省人力和时间成本。
19、4.本发明利用自监督深度学习神经网络进行识别,避免了人工影响因素造成的偏差。
20、5.本发明适用于各种仪器类型,对于不同仪器平台,可用同样方法进行模型训练。
技术特征:1.一种基于自监督深度学习诊断疾病的系统,其特征在于,所述系统包括数据集合模块、数据转换模块、蛋白表达生成模块和疾病诊断模块;
2.根据权利要求1所述的基于自监督深度学习诊断疾病的系统,其特征在于,所述待测者包括待诊断者、健康人和病人;所述待测者肽段水平的表达数据是通过质谱检测待测者的体液或组织所获得;所述数据集合为组学级别的数据。
3.根据权利要求1所述的基于自监督深度学习诊断疾病的系统,其特征在于,所述数据进行编码转换,是通过编码算法将肽段序列转换为编码,优选独热编码算法。
4.根据权利要求1所述的基于自监督深度学习诊断疾病的系统,其特征在于,所述自监督深度学习神经网络包括:输入层、卷积层、池化层、dropout层、全连接层、输出层;所述卷积层、池化层、dropout层、全连接层重复一次或多次;在重复多次的情况下,卷积层的输出连接下一次的池化层的输入,池化层的输出连接下一次的卷积层或dropout层的输入,全连接层的输出连接下一次的dropout层或输出层的输入。
5.根据权利要求4所述的基于自监督深度学习诊断疾病的系统,其特征在于,所述输入层输入编码后的肽段水平的表达数据;所述卷积层和池化层的组合进行特征提取;所述dropout层用于防止过拟合;所述全连接层进行特征整合;所述输出层对肽段水平的表达数据进行校正并输出。
6.根据权利要求1所述的基于自监督深度学习诊断疾病的系统,其特征在于,所述蛋白表达生成模块,通过整合算法,利用肽段水平的表达数据生成蛋白水平的表达数据,优选maxlfq算法。
7.根据权利要求1所述的基于自监督深度学习诊断疾病的系统,其特征在于,所述利用蛋白水平的表达数据对待测者是否患病进行判定,是采用无监督聚类算法进行判定;具体地,利用pca算法对蛋白水平的表达数据进行降维,对样本进行无监督聚类,通过对待诊断者与健康人和病人的距离关系,进行判定。
8.一种计算机介质,其特征在于,权利要求1-7任一项所述的系统整合在所述计算机介质中。
技术总结本发明公开了一种基于自监督深度学习诊断疾病的系统,所述系统包括数据集合模块、数据转换模块、蛋白表达生成模块和疾病诊断模块;所述数据集合模块,是收集质谱检测的待测者肽段水平的表达数据,形成数据集合;所述数据转换模块,是将上述数据集合中的数据进行编码转换,构造一个自监督深度学习神经网络,对肽段水平的表达数据进行校正;所述蛋白表达生成模块,是利用校正后的肽段水平的表达数据生成蛋白水平的表达数据;所述疾病诊断模块,是利用蛋白水平的表达数据对待诊断者是否患病进行判定。本发明利用组学级别数据,使用更全面的指标对疾病状态进行分析,对多种复杂因素导致的疾病,能产生更好的效果,节省人力和时间成本。技术研发人员:黄腾,姜浩,乔舰,赵小红,金川,张全全,景保伟,李捷受保护的技术使用者:谱天(天津)生物科技有限公司技术研发日:技术公布日:2024/10/17本文地址:https://www.jishuxx.com/zhuanli/20241021/318772.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表