一种基于LncRNA和免疫细胞特征的乳腺癌分型预测方法及系统
- 国知局
- 2024-11-19 09:42:48
本发明涉及人工智能,尤其涉及一种基于lncrna和免疫细胞特征的乳腺癌分型预测方法及系统。
背景技术:
1、乳腺癌是一种常见的恶性肿瘤,其临床分型对于制定有效的治疗方案和预测患者预后至关重要。免疫治疗的快速发展为乳腺癌治疗带来了新的可能性,尤其是免疫检查点抑制剂(ici)的应用。免疫治疗通过激活患者自身的免疫系统来抵抗肿瘤细胞,从而引起持久的抗肿瘤反应。目前,根据生物标记物的不同表达情况,乳腺癌可以被分为多种亚型,这些亚型在免疫治疗中的应答可能有所不同。以下是一些常见的乳腺癌临床分型和相应的分型方法或模型:
2、(1)激素受体状态(er、pr、her2):乳腺癌常根据雌激素受体(er)、孕激素受体(pr)、和人类表皮生长因子受体2(her2)的表达情况进行分类。这种分类不仅对于确定治疗方案具有指导意义,也可以与免疫治疗的疗效相关。
3、(2)免疫细胞浸润:免疫治疗的有效性与肿瘤周围的免疫细胞浸润密切相关。一些分型方法关注免疫细胞的类型和数量,例如淋巴细胞、浆细胞等,以帮助预测患者对免疫治疗的反应。
4、(3)pd-l1表达:程序性细胞死亡配体1(pd-l1)是一种免疫检查点分子,其过表达可能影响免疫治疗的效果。一些分型方法侧重于评估肿瘤细胞表面或免疫细胞上的pd-l1表达水平,作为预测免疫治疗响应的生物标志物。
5、(4)新抗原(neoantigen)负荷:新抗原是由突变引起的、在肿瘤细胞表面表达的抗原。一些分型模型关注肿瘤的新抗原负荷,因为高新抗原负荷可能与更强的免疫反应和更好的预后相关。
6、然而,目前已有的生物标记物都没有达到令人满意的精度。pd-l1表达是临床试验的分层因素或患者纳入标准,也是治疗指南中某些癌症类型使用ici的指征。但临床试验也发现icis在无pd-l1表达状态患者中的疗效。此外,只有一小部分患者对这些疗法有反应。由此可见,目前分型方式对于患者预后预测的效果不够确切。同时,现有的乳腺癌分型诊断大部分是基于免疫组化的检测结果,免疫组化的优点是特异性好、敏感性高、简便快速、费用相对低廉、重复性较好,缺点是不够全面,不同实验室间的结果可能存在不一致的结果。因此需要一种分型预测模型,结合人工智能技术对患者进行乳腺癌分型预测,辅助医疗工作者进行乳腺癌分型诊断和治疗方案的制定,在一定程度上克服免疫组化方法的局限性。
技术实现思路
1、针对上述技术问题,本发明提供一种基于lncrna和免疫细胞特征的乳腺癌分型预测方法及系统,由于所得到的乳腺癌分型预测结果表明了患者对免疫治疗的适用性,因此本发明提高了对患者进行免疫治疗的疗效预测和预后预测的准确性,为肿瘤治疗方案的制定提供数据支持。
2、第一方面,本发明提供一种基于lncrna和免疫细胞特征的乳腺癌分型预测方法,包括:
3、获取若干历史乳腺癌患者的第一rna测序数据集和若干接受免疫治疗患者的第二rna测序数据集;
4、将所述第一rna测序数据集输入至预设的lncrna聚类模型,以使所述lncrna聚类模型将所述第一rna测序数据集中的各个rna测序数据聚类为不同的lncrna亚型,其中,所述lncrna聚类模型是根据所述第二rna测序数据集的特征集合构建获得;
5、将所述第一rna测序数据集输入至预设的免疫细胞特征聚类模型,以使所述免疫细胞特征聚类模型将所述第一rna测序数据集中的各个rna测序数据聚类为不同的免疫亚型,其中,所述免疫细胞特征聚类模型是根据所述第二rna测序数据集的各个免疫细胞以及对应的ssgsea评分构建获得;
6、结合所述各个lncrna亚型和所述各个免疫亚型,获得若干不同的乳腺癌分型;
7、将待预测患者的病理切片图像输入至预设的分型预测模型,以使所述分型预测模型生成对应的乳腺癌分型预测结果,其中,所述乳腺癌分型预测结果为所述若干不同的乳腺癌分型的其中之一,所述分型预测模型是基于历史乳腺癌患者的病理切片数据和预训练的卷积神经网络模型构建获得。
8、本发明实施例提供一种基于lncrna和免疫细胞特征的乳腺癌分型预测方法,本实施例首先根据所述第二rna测序数据集构建lncrna聚类模型和免疫细胞特征聚类模型,用于挖掘第一rna测序数据集中的lncrna亚型和免疫亚型。然后,结合各个lncrna亚型和各个免疫亚型,构建获得若干乳腺癌分型。本实施例所构建的乳腺癌分型充分考虑了长链非编码rna和免疫细胞对肿瘤免疫治疗疗效的影响,重新构建了对免疫治疗更为敏感的乳腺癌分型,所述乳腺癌分型对免疫治疗疗效预测能力较传统的指标具有更好的敏感性和准确性。进一步的,与所述乳腺癌分型相适应,本实施例还提供一种基于病理图像的分型预测模型,避免了传统肿瘤分型所需的基因测序,仅借助临床病理切片即可进行分型预测,提高了乳腺癌分型预测的便利性与准确性,降低了所述乳腺癌分型的临床应用门槛,所得到的乳腺癌分型预测结果可以为医疗工作者制定癌症治疗方案提供决策依据。
9、在一种可能实现的方式中,所述根据所述第二rna测序数据集的特征集合构建获得所述lncrna聚类模型,包括:
10、从所述第二rna测序数据集中转录获得对应的lncrna表达数据集;
11、根据lncrna表达数据集中各个特征对免疫治疗的影响因子大小,从所述lncrna表达数据集中提取出若干lncrna特征,组合形成lncrna特征集;
12、根据所述lncrna特征集构建lncrna聚类模型。
13、本发明实施例提供一种lncrna聚类模型的构建方法,由于第二rna测序数据集的患者为接受免疫治疗患者,因此可以从第二rna测序数据集中提取出与免疫治疗相关的特征,进而构建这些特征构建聚类模型。具体的,首先将第二rna测序数据集转录为lncrna表达数据集,并从lncrna表达数据集中筛选出若干个影响疗效差异的lncrna,即为所述若干lncrna特征,组合形成lncrna特征集,最后根据这些特征集构建lncrna聚类模型。本实施例通过第二rna测序数据集构建lncrna聚类模型,提高了模型后续聚类的准确性,同时所构建的lncrna聚类模型属于无监督机器学习模型,不需要人为干预调整,可以自动对输入的数据集进行聚类,生成多个不同的lncrna亚型,提高了lncrna亚型生成的效率。
14、在一种可能实现的方式中,所述根据所述第二rna测序数据集的各个免疫细胞以及对应的ssgsea评分构建获得所述免疫细胞特征聚类模型,包括:
15、将所述第二rna测序数据集输入至预设的生物信息分析软件,以使所述生物信息分析软件通过ssgsea分析确定出若干种免疫细胞以及各种免疫细胞对应的ssgsea评分;
16、根据所述各种免疫细胞以及对应的ssgsea评分构建免疫细胞特征聚类模型。
17、本发明实施例提供一种免疫细胞特征聚类模型的构建方法,同样根据接受过免疫治疗患者的第二rna测序数据集进行模型的构建。首先通过预设的生物信息分析软件对第二rna测序数据集进行ssgsea分析,分析鉴定出第二rna测序数据集中的若干种免疫细胞以及各种免疫细胞对应的ssgsea评分,免疫细胞的ssgsea评分同样揭示了该免疫细胞对免疫治疗的影响,因此根据所述各种免疫细胞以及对应的ssgsea评分构建免疫细胞特征聚类模型。本实施例基于第二rna测序数据集,从免疫细胞的角度构建免疫细胞特征聚类模型,并结合各个免疫细胞的ssgsea评分,提高了模型后续聚类的准确性与合理性。
18、进一步的,所述结合所述各个lncrna亚型和所述各个免疫亚型,获得若干不同的乳腺癌分型,包括:
19、将所述各个lncrna亚型和所述各个免疫亚型进行两两组合,生成第一数量的lncrna-免疫亚型;
20、通过gsea代谢通路分析对各个所述lncrna-免疫亚型进行通路富集打分,获得对应的通路富集分数;
21、根据各个所述通路富集分数,确定各个所述lncrna-免疫亚型的代谢通路富集特征,合并相同代谢通路富集特征的lncrna-免疫亚型,得到第二数量的乳腺癌分型,其中,所述第二数量小于或等于所述第一数量。
22、在本发明实施例中,在得到各个lncrna亚型和各个免疫亚型后,进一步将其合并为二维指标,生成第一数量的lncrna-免疫亚型。而各个lncrna-免疫亚型中可能有对免疫治疗的治疗效果相近的lncrna-免疫亚型,为了提高后续分类预测的准确性和效率,需要将对免疫治疗的治疗效果相近的lncrna-免疫亚型进行合并,合并为同一个类型。因此,本实施例根据代谢通路富集特征作为各个lncrna-免疫亚型的评估指标,将代谢通路富集特征相同的lncrna-免疫亚型合并为同一个乳腺癌分型,最终可以获得第二数量的乳腺癌分型。本实施例所得到的乳腺癌分型显著的区分了不同的免疫治疗疗效以及预后生存时间,并揭示了各个乳腺癌分型的代谢内涵,为后续肿瘤治疗方案的制定提供数据支持。
23、在一种可能实现的方式中,所述分型预测模型根据待预测患者的病理切片图像生成对应的乳腺癌分型预测结果,包括:
24、根据所述病理切片图像中的组织区域对所述病理切片图像进行图像分割,获得若干图像块;
25、使用预训练参数的卷积神经网络模型从所述各个图像块中提取若干特征向量;
26、根据所述特征向量,使用基于注意力机制的多示例学习算法对所述各个图像块进行排序,并为每个图像块分配对应的注意力分数;
27、根据所述注意力分数聚合所述各个图像块的图像信息,生成聚合信息;
28、根据所述聚合信息,通过多分支网络架构和多任务目标,使用所述卷积神经网络模型对所述病理切片图像进行乳腺癌分型预测,生成待预测患者的乳腺癌分型预测结果。
29、本发明实施例提供一种根据病理切片图像进行乳腺癌分型预测的方法,以数字化高分辨率组织学切片的形式作为分型预测模型的输入。对于每张病理切片图像,自动分割组织内容,将其平均分割成几千到几万个区域作为小图像块。然后通过预训练参数的卷积神经网络模型从各个图像块中提取对应的特征向量。根据特征向量,对各个图像块排序,并根据图像块的相对重要性,即注意力分数,聚合各个图像块的图像信息,得到整个病理切片图像的聚合信息。最后根据聚合信息进行乳腺癌分型预测,生成待预测患者的乳腺癌分型预测结果,实现了基于数字病理切片特征的乳腺癌分型诊断,避免了传统肿瘤分型所需的基因测序,仅借助临床病理切片即可进行分型预测,提高了乳腺癌分型预测的便利性与准确性。
30、第二方面,相应的,本发明提供一种基于lncrna和免疫细胞特征的乳腺癌分型预测系统,包括获取模块、lncrna亚型生成模块、免疫亚型生成模块、乳腺癌分型生成模块以及预测模块;
31、其中,所述获取模块用于获取若干历史乳腺癌患者的第一rna测序数据集和若干接受免疫治疗患者的第二rna测序数据集;
32、所述lncrna亚型生成模块用于将所述第一rna测序数据集输入至预设的lncrna聚类模型,以使所述lncrna聚类模型将所述第一rna测序数据集中的各个rna测序数据聚类为不同的lncrna亚型,其中,所述lncrna聚类模型是根据所述第二rna测序数据集的特征集合构建获得;
33、所述免疫亚型生成模块用于将所述第一rna测序数据集输入至预设的免疫细胞特征聚类模型,以使所述免疫细胞特征聚类模型将所述第一rna测序数据集中的各个rna测序数据聚类为不同的免疫亚型,其中,所述免疫细胞特征聚类模型是根据所述第二rna测序数据集的各个免疫细胞以及对应的ssgsea评分构建获得;
34、所述乳腺癌分型生成模块用于结合所述各个lncrna亚型和所述各个免疫亚型,获得若干不同的乳腺癌分型;
35、所述预测模块用于将待预测患者的病理切片图像输入至预设的分型预测模型,以使所述分型预测模型生成对应的乳腺癌分型预测结果,其中,所述乳腺癌分型预测结果为所述若干不同的乳腺癌分型的其中之一,所述分型预测模型是基于历史乳腺癌患者的病理切片数据和预训练的卷积神经网络模型构建获得。
36、在一种可能实现的方式中,所述根据所述第二rna测序数据集的特征集合构建获得所述lncrna聚类模型,包括:
37、从所述第二rna测序数据集中转录获得对应的lncrna表达数据集;
38、根据lncrna表达数据集中各个特征对免疫治疗的影响因子大小,从所述lncrna表达数据集中提取出若干lncrna特征,组合形成lncrna特征集;
39、根据所述lncrna特征集构建lncrna聚类模型。
40、在一种可能实现的方式中,所述根据所述第二rna测序数据集的各个免疫细胞以及对应的ssgsea评分构建获得所述免疫细胞特征聚类模型,包括:
41、将所述第二rna测序数据集输入至预设的生物信息分析软件,以使所述生物信息分析软件通过ssgsea分析确定出若干种免疫细胞以及各种免疫细胞对应的ssgsea评分;
42、根据所述各种免疫细胞以及对应的ssgsea评分构建免疫细胞特征聚类模型。
43、进一步的,所述乳腺癌分型生成模块结合所述各个lncrna亚型和所述各个免疫亚型,获得若干不同的乳腺癌分型,包括:
44、将所述各个lncrna亚型和所述各个免疫亚型进行两两组合,生成第一数量的lncrna-免疫亚型;
45、通过gsea代谢通路分析对各个所述lncrna-免疫亚型进行通路富集打分,获得对应的通路富集分数;
46、根据各个所述通路富集分数,确定各个所述lncrna-免疫亚型的代谢通路富集特征,合并相同代谢通路富集特征的lncrna-免疫亚型,得到第二数量的乳腺癌分型,其中,所述第二数量小于或等于所述第一数量。
47、在一种可能实现的方式中,所述预测模块包括图像分割单元、特征提取单元、排序单元、信息聚合单元以及预测单元;
48、其中,所述图像分割单元用于根据所述病理切片图像中的组织区域对所述病理切片图像进行图像分割,获得若干图像块;
49、所述特征提取单元用于使用预训练参数的卷积神经网络模型从所述各个图像块中提取若干特征向量;
50、所述排序单元用于根据所述特征向量,使用基于注意力机制的多示例学习算法对所述各个图像块进行排序,并为每个图像块分配对应的注意力分数;
51、所述信息聚合单元用于根据所述注意力分数聚合所述各个图像块的图像信息,生成聚合信息;
52、所述预测单元用于根据所述聚合信息,通过多分支网络架构和多任务目标,使用所述卷积神经网络模型对所述病理切片图像进行乳腺癌分型预测,生成待预测患者的乳腺癌分型预测结果。
本文地址:https://www.jishuxx.com/zhuanli/20241118/329907.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。