用于病理细胞分类模型的训练样本生成方法与流程
- 国知局
- 2024-09-19 14:42:42
本发明涉及数字病理图像处理,特别涉及一种用于病理细胞分类模型的训练样本生成方法。
背景技术:
1、随着计算机技术的发展,疾病诊断治疗方面也更多的依赖细胞学数字病理图像。通过对数字病理图像进行计算机分析处理以得到辅助诊断结果,可以帮助病理学家确定诊断、提高诊断的一致性和准确性。
2、目前,通常采用病理细胞分类模型来对数字病理图像进行分析处理,其中最核心的技术之一便是细胞检测和分类技术,该技术涉及识别和分类组织切片上的细胞,包括判断细胞是否为恶性。为了提高该技术的准确性,则必须要对病理细胞分类模型进行有效训练,因此需要大量的标注数据。
3、然而,在复杂的现实制片和染色环境中,在多变的多中心数据条件下,往往存在标注模型训练数据困难,困难样本难以大量复现和标注的情况。虽然可以采用样本合成的方式对已有的样本进行变换、扩充或组合,如通过调整细胞形态、颜色、纹理等特征来合成具有挑战性的样本,但这种方法必须需要人工参与和专业知识,且生成的样本可能缺乏多样性和真实性。而且,获取高质量的训练样本需要花费大量的人力物力,成本高昂。
4、此外,在实际的细胞检测和分类中,正常细胞和癌细胞的比例通常是极度不平衡的,这使得病理细胞分类模型在训练过程中容易偏向于多数类,导致对少数类(即癌细胞)的检测和分类性能不佳;同时,由于癌细胞的形态和类型多样,现有的病理细胞分类模型往往在面对未见过的癌细胞类型时,检测和分类性能会大幅下降。
技术实现思路
1、本发明的目的在于提供一种用于病理细胞分类模型的训练样本生成方法,以解决如何高效地生成多样化的训练样本的问题。
2、为解决上述技术问题,本发明提供一种用于病理细胞分类模型的训练样本生成方法,包括:
3、获取已标注的数字病理图像;
4、构建去噪扩散生成模型,并利用已标注的数字病理图像训练去噪扩散生成模型;
5、利用去噪扩散生成模型,将随机噪声图像生成训练样本;
6、根据预设复核标准对生成的训练样本进行复核,并保存符合预设复核标准的训练样本。
7、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,所述已标注的数字病理图像中标注有癌细胞、正常细胞和其他检测分类的目标细胞。
8、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,所述去噪扩散生成模型包括u型编码网络;所述u型编码网络包括跳跃连接的编码器和解码器;所述编码器包括交错设置的卷积层和平均池化层;所述解码器包括交错设置的卷积层和反卷积层。
9、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,所述卷积层的卷积核为3×3;所述平均池化层的卷积核为2×2;所述反卷积层的卷积核为2×2;所述卷积层设有leakyrelu函数。
10、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,所述利用已标注的数字病理图像训练去噪扩散生成模型的方法包括:
11、获取训练数据,其中,所述训练数据包括多个细胞样本图片,每一所述细胞样本图片包含有其从原始细胞图片逐步扩散成噪声图的所有时刻所对应的细胞图片;
12、利用训练数据,对去噪扩散生成模型进行训练,直至去噪扩散生成模型收敛。
13、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,所述利用训练数据,对去噪扩散生成模型进行训练的方法包括:
14、从训练数据中抽取一细胞样本图片;
15、从细胞样本图片中随机抽取某一时刻所对应的细胞图片;
16、利用去噪扩散生成模型以正向传播预测细胞图片中的噪声,并计算损失值;
17、根据损失值更新去噪扩散生成模型,并重复上述训练过程,直至去噪扩散生成模型收敛。
18、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,对去噪扩散生成模型进行训练的方法还包括:
19、利用训练后的去噪扩散生成模型生成病理样本图像;
20、对病理样本图像进行打分,以得到病理样本图像的评分;
21、构建强化学习奖励模型;
22、将病理样本图像及其评分输入至强化学习奖励模型中,以得到奖励分数;
23、根据奖励分数,对去噪扩散生成模型的解码器进行微调。
24、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,所述强化学习奖励模型包括依次设置的swin transformer模型、logits函数和sigmoid激活函数;所述swin transformer模型的输入为去噪扩散生成模型生成的病理样本图像,输出至所述logits函数;所述logits函数用于将所述swin transformer模型输出的特征映射到[0,1]中;所述sigmoid激活函数的输入为所述logits函数的输出和病理样本图像的评分,输出为奖励分数。
25、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,所述对去噪扩散生成模型的解码器进行微调所采用的公式为:
26、yt=a×pθ(xt)+b×sigmoid(xt)+c
27、其中,a、b和c为可学习的线性参数,xt为从原始细胞图片逐步扩散成噪声图时t时刻所对应的细胞图片;pθ()为去噪扩散生成模型的反向传播函数;yt为解码器的参数。
28、可选的,在所述的用于病理细胞分类模型的训练样本生成方法中,所述根据预设复核标准对生成的训练样本进行复核,并保存符合预设复核标准的训练样本的方法包括:
29、从生成的训练样本中随机抽取预设比例的训练样本;
30、利用强化学习奖励模型对抽取的训练样本进行评分;
31、若评分超过预设评分阈值的训练样本数占抽取的训练样本总数的比例超过预设占比,则保存本次生成的全部训练样本,否则,丢弃本次生成的全部训练样本,并重新训练去噪扩散生成模型。
32、本发明提供的用于病理细胞分类模型的训练样本生成方法,包括:获取已标注的数字病理图像;构建去噪扩散生成模型,并利用已标注的数字病理图像训练去噪扩散生成模型;利用去噪扩散生成模型,将随机噪声图像生成训练样本;根据预设复核标准对生成的训练样本进行复核,并保存符合预设复核标准的训练样本。通过去噪扩散生成模型生成训练样本,能够大大减小训练样本生成的工作量,且能够生成包括各种形态和类型癌细胞的训练样本,不仅增加了训练样本的个数,还提高了训练样本的质量和多样性,解决了如何高效地生成多样化的训练样本的问题。
技术特征:1.一种用于病理细胞分类模型的训练样本生成方法,其特征在于,包括:
2.根据权利要求1所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述已标注的数字病理图像中标注有癌细胞、正常细胞和其他检测分类的目标细胞。
3.根据权利要求1所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述去噪扩散生成模型包括u型编码网络;所述u型编码网络包括跳跃连接的编码器和解码器;所述编码器包括交错设置的卷积层和平均池化层;所述解码器包括交错设置的卷积层和反卷积层。
4.根据权利要求3所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述卷积层的卷积核为3×3;所述平均池化层的卷积核为2×2;所述反卷积层的卷积核为2×2;所述卷积层设有leakyrelu函数。
5.根据权利要求3所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述利用已标注的数字病理图像训练去噪扩散生成模型的方法包括:
6.根据权利要求5所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述利用训练数据,对去噪扩散生成模型进行训练的方法包括:
7.根据权利要求6所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述利用训练数据,对去噪扩散生成模型进行训练的方法还包括:
8.根据权利要求7所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述强化学习奖励模型包括依次设置的swin transformer模型、logits函数和sigmoid激活函数;所述swin transformer模型的输入为去噪扩散生成模型生成的病理样本图像,输出至所述logits函数;所述logits函数用于将所述swin transformer模型输出的特征映射到[0,1]中;所述sigmoid激活函数的输入为所述logits函数的输出和病理样本图像的评分,输出为奖励分数。
9.根据权利要求7所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述对去噪扩散生成模型的解码器进行微调所采用的公式为:
10.根据权利要求7所述的用于病理细胞分类模型的训练样本生成方法,其特征在于,所述根据预设复核标准对生成的训练样本进行复核,并保存符合预设复核标准的训练样本的方法包括:
技术总结本发明提供一种用于病理细胞分类模型的训练样本生成方法,包括:获取已标注的数字病理图像;构建去噪扩散生成模型,并利用已标注的数字病理图像训练去噪扩散生成模型;利用去噪扩散生成模型,将随机噪声图像生成训练样本;根据预设复核标准对生成的训练样本进行复核,并保存符合预设复核标准的训练样本。通过去噪扩散生成模型生成训练样本,能够大大减小训练样本生成的工作量,且能够生成包括各种形态和类型癌细胞的训练样本,不仅增加了训练样本的个数,还提高了训练样本的质量和多样性,解决了如何高效地生成多样化的训练样本的问题。技术研发人员:卢成煜,苏永健,李胜男,潘威君,尚滨,彭铃淦受保护的技术使用者:广州锟元方青医疗科技有限公司技术研发日:技术公布日:2024/9/17本文地址:https://www.jishuxx.com/zhuanli/20240919/299775.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表