基于异常检测预训练的心电图长尾分类方法、装置及介质
- 国知局
- 2024-11-06 14:24:59
本发明涉及数据处理,尤其是涉及一种基于异常检测预训练的心电图长尾分类方法、装置及介质。
背景技术:
1、在过去几年中,分类模型在心电图诊断领域取得了巨大成功,在特定常见类型的心电异常诊断上取得了较高的准确率。但现有的心电图诊断技术面临长尾分布问题,即常见病的样本数量多,而罕见病样本数量少,导致模型容易忽略少数类别的异常。此外,监督学习方法需要大量人工标注的数据,而罕见病样本往往难以获取,限制了模型的泛化能力。
2、“multi-scale cross-restoration framework for electrocardiogramanomaly detection”提出了一种基于多尺度交叉恢复的异常检测算法,其从多尺度的心电数据出发,通过多尺度的心电特征相互交互,以实现更好的心电特征学习。通过在正常心电上进行学习,将所有不同于正常特征的样本均视为异常,可认为是一种二分类的心电诊断任务。此外,在针对每个患者心电进行二分类正常或异常的结论基础上,能够给出细粒度的心电异常定位结果,辅助医生进行判断。该论文虽然提出了心电异常检测方法,但整个系统的构建流程还是局限于二分类的异常检测,没有考虑后续的心电长尾诊断流程以及属性指标对心电诊断的影响,仍有提升空间。
3、cn117958834a公开了一种基于随机掩码和生成式自监督学习的心电分类方法,将原始心电信号在一定约束下将导联信号随机遮掩破坏掉原始心电信号的完整性,然后再通过编码器生成随机掩蔽策略下的信号,重构在时间和导联维度上遮掩的导联心电信号来学习时空表征。但是,该方法仅考虑了局部信号,对信号特征的表示较为片面,导致分类结果精度收到影响,并且其也未考虑属性的影响。
4、综上,现有的心电图分类预测方法存在以下缺陷:
5、1、未考虑心电数据长尾分布的特性。长尾是一种概率分布,其特征是头部有较少但频率很高的事件,而尾部有大量频率较低的罕见事件。这意味着其分类结果包括:①少数高频异常类型:有少数几种心电异常类型(例如,房颤或室性早搏)在患者中比较常见,出现的频率很高。这些异常类型位于长尾分布的“头部”;②大量低频异常类型:有大量其他心电异常类型在患者中相对少见,出现的频率很低。这些异常类型位于长尾分布的“尾部”。其中高频异常类型的样本数量多,而低频异常类型的样本数量少,需要诊断出准确的异常类型。但是目前的方法大多直接在高频常见异常类型上进行分类,忽略对低频罕见异常类型的分类。
6、2、未考虑属性指标的影响。目前的方法仅基于单纯的心电图进行分析,未考虑到患者的属性信息例如年龄性别,以及常见的心电指标例如心率等数值对心电分类结果的影响。
技术实现思路
1、本发明的目的是提供一种基于异常检测预训练的心电图长尾分类方法、装置及介质,考虑属性指标,实现常见异常类型以及罕见异常类型的准确分类。
2、本发明的目的可以通过以下技术方案来实现:
3、一种基于异常检测预训练的心电图长尾分类方法,包括以下步骤:
4、获取多尺度心电图信号;
5、获取心电报告信息,从心电报告中提取报告属性信息和分类结果;
6、基于多尺度心电图信号和报告属性信息预训练异常检测模型,所述异常检测模型对输入的多尺度心电图信号进行信号预处理,得到全局心电信号和局部心电信号,对全局心电信号和局部心电信号进行多尺度交叉恢复,对全局心电信号进行信号趋势辅助恢复,并进行报告属性预测;
7、以信号趋势辅助恢复中得到的信号趋势特征和多尺度交叉恢复中得到的全局心电特征的串联组合作为长尾分类网络的输入,从心电报告中提取的分类结果作为输出,训练长尾分类网络;
8、将待检测心电图信号输入预训练完成的异常检测模型,对得到的信号趋势特征和全局心电特征进行串联组合,并将组合得到的特征输入到下游的长尾分类网络进行异常类型多分类,得到分类预测结果概率。
9、所述异常检测模型对输入的多尺度心电图信号进行信号预处理具体为:
10、针对带噪声的心电图原始信号,通过信号滤波器去除基线漂移和高频噪声干扰,得到去噪后的心电图信号;
11、采用滑动窗口方法,以最小化连续差异的标准差为目标,自适应计算动态阈值,检测去噪后的心电图信号中的r峰;
12、根据检测到的r峰位置,对心电图信号进行分段,得到单次心跳的局部信号;
13、基于上述步骤得到全局心电信号和局部心电信号。
14、所述报告属性信息包括年龄、性别、心率、pr间期、qt间期、qrs间期以及修正qrs间期。
15、所述多尺度交叉恢复包括以下步骤:
16、对多尺度心电信号进行随机掩膜,在全局心电信号xg上针对散布的区域进行随机掩膜,在局部心电信号xl上对特定连续区域进行随机掩膜,得到掩膜后的信号记为和
17、分别利用独立的全局编码器eg和局部编码器el进行信号特征提取,得到全局特征和局部特征;
18、通过串联的方式将全局特征和局部特征融合成一个统一的交叉注意力特征:
19、
20、其中,(·)t为矩阵转置操作,softmax(·)是一种归一化指数函数,表示特征维数的平方根作为缩放因子,concat(·)表示将两个张量进行串联;
21、得到融合特征信息后,通过两个不同的全连接网络将融合特征信息重新划分为多尺度的心电特征,并与经过注意力机制之前的多尺度心电特征进行残差连接,得到全局心电特征fg和局部心电特征fl;
22、对多尺度心电特征进行解码恢复:利用独立的全局解码器dg和局部解码器dl为多尺度心电特征分别生成全局恢复信号局部恢复信号和对应的不确定度σg,σl。
23、所述信号趋势辅助恢复包括以下步骤:
24、对全局心电信号xg在时间维度上应用滑动平均窗口进行平滑处理;
25、对平滑后的信号进行相邻信号点的差分并归一化,得到全局心电信号的趋势信号,记为xt;
26、利用信号特征提取网络提取趋势信号的高维特征信息,记为信号趋势特征ft,与多尺度交叉恢复中得到的全局心电特征fg进行串联合并,并通过解码器重建全局心电信号,对掩膜遮挡区域进行辅助恢复,得到基于趋势的恢复信号
27、所述报告属性预测具体为:利用属性预测网络针对信号趋势特征和全局心电特征的串联组合进行报告属性预测。
28、所述异常检测模型的损失函数由全局和局部的多尺度交叉恢复的损失函数、信号趋势辅助恢复的损失函数、报告属性预测的损失函数在不同层次上加权平均得到:
29、
30、其中,λ1,λ2,λ3,λ4为超参数,为全局多尺度交叉恢复的损失函数,为局部多尺度交叉恢复的损失函数,为信号趋势辅助恢复的损失函数,为报告属性预测的损失函数;
31、通过分别将全局恢复信号和局部恢复信号与掩膜之前的全局和局部心电信号xg、xl进行比较,计算多尺度交叉恢复的损失函数:
32、
33、其中,上标k表示时间维度的信号点,d和d分别表示全局和局部心电的时间长度;
34、将基于趋势的恢复信号与原始的全局心电信号xg进行比较,计算信号趋势辅助恢复的损失函数:
35、
36、将预测报告属性值与心电报告记录的真实属性值进行比较,计算报告属性预测的损失函数:
37、
38、其中,yi为真实报告属性值,为预测报告属性值,n为报告属性数量。
39、将长尾分类网络的预测分类结果与心电报告记录的真实分类结果进行比较,利用对称损失函数进行监督,实现对长尾分类网络的训练,所述对称损失函数表示为:
40、
41、其中,γ+,γ-表示对多标签分类中正负标签的调配系数,为真实分类结果,pkm=max(pk-m,0)表示对容易分类的负标签进行阈值筛选,其中pk表示模型对第k种类型的分类预测结果,m是一个固定数值用于过滤预测结果较低,即容易分类的类别,k为分类结果的种类数量。
42、一种基于异常检测预训练的心电图长尾分类装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法。
43、一种存储介质,其上存储有程序,所述程序被执行时实现如上述所述的方法。
44、与现有技术相比,本发明具有以下有益效果:
45、1、本发明利用自监督的异常检测技术,在不需要额外监督数据的基础上,利用正常数据进行训练,使得心电图辅助分类能够识别不同于正常的所有类型的心脏异常,包括常见和罕见的异常,不仅限于特定类型的异常。
46、2、本发明利用属性信息预测技术,通过将模型预测属性与心电报告中的真实属性进行比较,引入心电报告中的属性信息,从而降低心电个体差异带来的影响,提高了分类结果的全面性和可靠性。
本文地址:https://www.jishuxx.com/zhuanli/20241106/321935.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表