一种基于多示例学习和软标签的宫颈细胞涂片年龄评估方法及系统与流程
- 国知局
- 2024-07-31 22:41:12
本发明涉及深度学习与医学交叉领域,具体涉及一种基于多示例学习和软标签的宫颈细胞涂片年龄评估方法及系统。
背景技术:
1、通过早期筛查、早期诊断和早期干预,众多患病妇女得到了及时的救助,宫颈筛查不仅能使宫颈癌和癌前病变得以更早的发现和治疗,明显降低宫颈癌的发病率和死亡率,还能通过定期筛查有效提升妇女的健康水平。实际上,宫颈细胞筛查所采集的宫颈细胞涂片蕴含的信息十分丰富,除了可以用于宫颈癌的早期诊断外,还能提供有关受试者身体健康状态的其他病理信息。例如,宫颈细胞的状态与受试者所处的年龄阶段和生理阶段密切相关,不同年龄阶段的受试者主体,其宫颈细胞涂片也会存在较大差异。通过进一步利用宫颈细胞筛查数据,分析宫颈细胞涂片特征所展现的年龄阶段与受试者实际年龄之间的差异,宫颈细胞年龄评估结果如果出现异常很可能意味着宫颈细胞存在异常变化,需要进一步的检查和评估,可以进一步为受试者提供健康指导。
2、虽然宫颈细胞涂片的年龄评估可以辅助宫颈健康状态评估、为受试者的生活方式和生殖提供指导,但是基于宫颈细胞涂片直接评估受试者年龄仍然存在一些难点。第一,宫颈细胞涂片大分辨率高,计算机难以直接处理整张细胞涂片并给出评估结果。第二,年龄的增长具有连续特性,这使得相似的年龄阶段之间其宫颈细胞图片的额特征也会出现一些相似性,而不是从一种状态到另一种状态的突变,这使得我们在进行模型设计的时候不得不考虑这一特殊性质。
技术实现思路
1、本发明的主要目的在于提供一种基于多示例学习和软标签的宫颈细胞涂片年龄评估方法及系统,解决基于宫颈细胞涂片进行年龄评估时遇到的处理高分辨率涂片问题以及未考虑年龄的增长性和关联性的问题。
2、为解决上述技术问题,本发明所采用的技术方案是:一种基于多示例学习和软标签的宫颈细胞涂片年龄评估方法,包括以下步骤:
3、s1、采集宫颈细胞涂片及其对应的年龄标签;
4、s2、通过标签平滑处理制作宫颈细胞涂片对应的软标签;
5、s3、将宫颈细胞涂片切分成互不重叠的patch,使用随机掩蔽策略将每个涂片对应的patch包划分为m个子包;
6、s4、使用自监督预训练的深度卷积神经网络提取patch特征;
7、s5、将patch特征通过基于注意力机制的聚合模型进行嵌入和聚合,得到涂片的特征嵌入;
8、s6、构造基于涂片特征嵌入的年龄评估分类器;
9、通过以上步骤实现根据宫颈细胞涂片评估生理年龄。
10、优选方案中,所述步骤s1中,年龄范围应当广泛并均匀分布在各年龄段,选择处于s1至sk岁的若干宫颈涂片作为训练样本,其中s1<sk。
11、优选方案中,所述步骤s2中,标签平滑处理具体包括以下子步骤:
12、s21、将年龄标签α广播到一个k维向量并与标准值向量s=[s1,s2,…,sk]进行作差,计算到各标准年龄的距离得到对差值向量
13、其中,s1,s2…sk为均匀递增的序列,即标准值向量或表示为s=[s1,s1+c,…,s1+(k-1)c],s1+(k-1)c=sk,c为递增公差;
14、s22、通过对差值向量d0取绝对值获得距离的标量表示d;
15、s23、通过softmax函数将距离标量表示d平滑处理为软标签l:
16、
17、优选方案中,所述步骤s3中,采用随机掩蔽策略对宫颈细胞涂片中的所有n个patch进行不放回随机采样m次,每次采样生成一个具有n/m个patch的子包,在后续训练过程中,每个子包作为一个独立的宫颈细胞涂片进行年龄评估训练。
18、优选方案中,所述步骤s4中,自监督深度神经网络以resnet50结构作为网络架构,并选用simclr作为训练特征提取器的自监督对比学习框架。
19、优选方案中,所述步骤s4中,使用simclr作为自监督对比学习框架训练特征提取器时使用步骤s3中切分出的所有patch进行训练,后续年龄评估训练和推理阶段特征提取器所有参数被冻结,不再进行参数学习。
20、优选方案中,所述步骤s5中,注意力聚合模块具体包括以下子步骤:
21、s51、对步骤s4提取出的patch特征fi进行两次全连接操作,得到一个可学习的注意力分数ai=wttanh(vfit),其中w和v为网络层的可学习参数,tanh(·)为激活函数;
22、s52、通过softmax函数将所有的注意力分数归一化,即其中k为步骤s3中随机划分后宫颈细胞涂片子包内的patch数量;
23、s53、使用注意力分数对patch嵌入特征进行加权,聚合成涂片嵌入特征
24、优选方案中,所述步骤s6中,分类器由若干全连接层构成,训练所使用的损失函数为评估年龄向量与软标签向量之间的交叉熵损失;
25、在推理阶段,分类器将受试者的年龄评估为分类概率值最大的年龄区间。
26、优选方案中,将生理年龄与受试者个体的实际年龄进行比较,若生理年龄大于实际年龄,则建议受试者进行进一步的检查。
27、本发明还提供一种基于多示例学习和软标签的宫颈细胞涂片年龄评估系统,系统用于实现基于多示例学习和软标签的宫颈细胞涂片年龄评估方法,系统包括数据采集与预处理模块、标签处理模块、图像切分与掩蔽模块、特征提取和特征聚合模块、年龄评估分类器模块;
28、数据采集与预处理模块,用于采集宫颈细胞涂片及其对应的年龄标签,并对这些数据进行初步的处理;
29、标签处理模块,负责对采集到的年龄标签进行平滑处理,获得宫颈细胞涂片对应的软标签;
30、图像切分与掩蔽模块,用于获得宫颈细胞涂片切分和划分子包,将宫颈细胞涂片切分成互不重叠的patch,并使用随机掩蔽策略将每个涂片对应的patch包划分为多个子包;
31、特征提取和特征聚合模块,用于patch特征提取和获得涂片特征嵌入,利用自监督预训练的深度卷积神经网络提取patch的特征,并将patch的特征嵌入基于注意力机制的聚合模型,获得涂片特征嵌入;
32、年龄评估分类器模块,用于预测宫颈细胞涂片对应的年龄区间,利用涂片特征嵌入,通过年龄评估分类器,输出的评估概率最大值处,并通过索引获得对应的年龄区间。本发明提供了一种基于多示例学习和软标签的宫颈细胞涂片年龄评估方法及系统,能够根据宫颈细胞的数据辅助评估受试者的生理年龄,并用于提出健康预警。通过使用多示例学习方法和无监督对比学习使得模型能够有效学习宫颈细胞涂片特征而不需要额外的多级别细节标注以及得以处理分辨率极大的宫颈细胞涂片,利用标签平滑处理制作年龄软标签将各年龄阶段在时间上的关联性和连续性引入考虑,从而进一步从可解释性提高的角度提升宫颈细胞涂片年龄评估的准确率。
33、本发明的有益效果如下:
34、(1)本发明通过搭建多示例分类模型可以有效解决宫颈细胞涂片分辨率过大计算机无法直接进行处理的问题,同时使用自监督对比学习提取和学习patch特征而不需要进行额外的数据标注;
35、(2)本发明利用标签平滑处理制作年龄软标签将各年龄阶段在时间上的关联性和连续性引入考虑,从而进一步从可解释性提高的角度提升宫颈细胞涂片年龄评估的准确率;
36、(3)本发明通过随机掩蔽策略将一个宫颈细胞涂片中的patch进行分组,分别进行模型训练,以此在实现数据增强的基础上可以提高模型对于特征学习的鲁棒性,从而提升模型的评估性能;
37、(4)本发明利用基于注意力机制的特征聚合模块实现可学习的注意力分数计算,使得能够更加有效地挖掘出具有更多年龄特征的关键patch和关键细胞特征。
本文地址:https://www.jishuxx.com/zhuanli/20240730/194121.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表