技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 基于辅助分类器生成对抗网络的心电数据生成方法 > 正文

基于辅助分类器生成对抗网络的心电数据生成方法

国知局
2024-11-19 09:46:37

本发明涉及医学数据处理及人工智能领域，尤其涉及一种基于辅助分类器生成对抗网络(auxiliary classifier generative adversarial networks，ac-gan)的心电数据生成方法。

背景技术：

1、心电图(electrocardiogram，ecg)作为检测心脏健康状况的重要手段，广泛应用于临床诊断。然而，心电数据通常具有高维度、强噪声和样本不平衡等特点，这使得基于心电数据的机器学习模型在训练过程中面临挑战。为了提高心电数据的质量和数量，数据生成技术被广泛应用。传统的数据生成强方法(如随机噪声加入、平移、旋转等)往往缺乏对心电数据特征的深刻理解，不能有效地改善模型性能。生成对抗网络(generativeadversarial network，gan)作为一种强大的数据生成模型，通过生成器和判别器的对抗训练，可以生成高质量的合成数据。然而，经典gan在生成心电数据时，容易产生模式崩溃和多样性不足的问题，同时现有方法没有充分考虑多导联心电数据的时空特性、未聚焦多导联心电数据中的关键特征。

2、申请号为cn202111321899.3，名称为《基于生成式对抗网络的情绪脑电数据增强模型及扩充样本的方法》的发明专利，公开了一种电数据增强模型及扩充样本的方法，其将情绪脑电拓扑图映射到潜在空间,并将潜在向量输入到生成器中，通过潜在向量学习情绪脑电拓扑图的空间分布,该模型对应的生成式对抗网络中有两个鉴别器和一个生成器,两个鉴别器均由神经网络构成,结构相同但不共享参数；其中一个鉴别器对符合真实数据分布的样本给予高分奖励；另一个鉴别器对生成器生成的样本给予高分奖励；通过生成器和两个鉴别器之间的博弈,使得生成器生成合成样本的分布无限接近真实数据的分布。辅助分类器生成对抗网络(ac-gan)通过引入辅助分类器，可以进一步控制生成数据的类别，提高生成数据的质量和多样性。该发明提出的情绪脑电数据增强模型通过结合变分自编码器和生成式对抗网络,充分发挥各自优势,生成的样本多样性更好。但这种方法不能直接生成指定类型的数据，未将该类型数据的先验知识参与到新数据的生成过程中，数据质量有待进一步提高。

技术实现思路

1、本发明的目的是提供一种基于辅助分类器生成对抗网络的心电数据生成方法，能够解决现有数据生成方法生成心电数据质量不高、类别不全的问题，有效提高心电数据生成质量，并提高心电数据集的多样性和数量，从而提升心电智能辅助诊断模型的性能。

2、本发明采用下述技术方案：

3、一种基于辅助分类器生成对抗网络的心电数据生成方法，依次包括以下步骤：

4、a：获取不同类型的心电数据样本；

5、b：将对应类型心电数据的先验知识引入基于自注意力机制的生成器和基于时空特征的判别器的构建中，聚焦并突出不同类型心电图数据的关键时空特征，得到基于辅助分类器的生成对抗网络模型；

6、c：设计判别器损失函数和生成器损失函数，结合不同类型的心电数据样本对基于辅助分类器生成对抗网络模型进行训练，得到训练后的基于辅助分类器生成对抗网络模型；

7、d：利用训练后的基于辅助分类器生成对抗网络模型，对不同类型的心电数据样本进行扩充处理。

8、所述的步骤b中，基于自注意力机制的生成器，将包含随机噪声z和类别标签label的向量a作为输入，生成与类别标签label对应的心电数据即向量z作为输出；

9、基于自注意力机制的生成器包含长短期记忆网络模块、基于transformer的自注意力模块和因果卷积模块；因果卷积模块和长短期记忆网络模块用于分别获取心电图的空间表征信息和各心拍采样点的时间信息，基于transformer的自注意力模块用于为获取的空间表征信息和时间信息表征分配注意力权重。

10、所述的长短期记忆网络模块，将由向量a经过维度变换后得到向量xt作为输入，生成包含待生成心电数据短期和长期时序依赖关系的向量ht作为输出；ht＝lstm(xt)，lstm表示长短期记忆网络模块；长短期记忆网络模块用于表征不同导联心电数据的复杂性，获取心电图各心拍采样点出现的时间信息；

11、所述的基于transformer的自注意力模块，将向量ht作为输入，生成包含待生成心电数据任意时间步之间关系和时间步重要性信息的向量at作为输出；基于transformer的自注意力模块用于捕捉具有时间序列特性的心电数据长程依赖关系，且自适应地为心电图的信息表征分配注意力权重；

12、所述的因果卷积模块，将向量at作为输入，生成向量z作为输出；因果卷积模块用于引入膨胀卷积扩大心电图数据的感受野，捕捉心电图的空间表征信息。

13、首先，自注意力模块对向量ht进行线性变换，分别生成查询向量q、键向量k和值向量v；其中，q＝wqht+bq，k＝wkht+bk，v＝wvht+bv；wq、wk和wv分别表示查询向量q、键向量k和值向量v对应的权重矩阵；bq、bk和bv分别表示查询向量q、键向量k和值向量v对应的偏置；

14、然后，自注意力模块基于得到的查询向量q和键向量k，计算得到注意力分数score(q,k)，score(q,k)＝q·kt，其中t表示矩阵中的转置符号；

15、随后，自注意力模块将注意力分数score(q,k)通过softmax函数转换为注意力权重分布，得到查询向量qi对键向量kj的注意力权重aij，其中，i表示第i个查询向量，j表示第j个键向量，t1表示键向量的总个数；

16、之后，自注意力模块使用注意力权重aij对值向量v进行加权求和，得到对应的注意力输出为：其中k表示第k个值向量，t2表示值向量的总个数；

17、最后，自注意力模块将注意力输出通过线性变换，最终得到基于transformer的自注意力模块的输出向量at。

18、所述的步骤b中，基于时空特征的判别器将心电数据g作为输入，分别生成输入为真实心电数据的概率dreal和输入为对应类别标签的概率dclass；

19、基于时空特征的判别器包含基于空间特征的卷积神经网络判别模块、基于时间特征的双向长短期记忆网络模块、心电数据真实性判别模块和心电数据类别判别模块；基于时空特征的判别器，用于同时处理导联内心拍的动态变化和多个导联间的空间关系，判断生成心电数据的真实性以及时间序列特征的合理性。

20、所述的基于空间特征的卷积神经网络判别模块，将心电数据g作为输入，生成包含表征输入心电数据空间特征信息的向量h并作为输出；基于空间特征的卷积神经网络判别模块用于判断生成心电数据空间信息表征的准确性和合理性；

21、所述的基于时间特征的双向长短期记忆网络模块，将向量h作为输入，生成包含表征心电数据时序特征信息的向量l并作为输出；基于时间特征的双向长短期记忆网络模块用于判断生成心电数据时间信息表征的准确性和合理性；

22、所述的心电数据真实性判别模块，将向量l作为输入，生成输入为真实心电数据的概率dreal并作为输出；心电数据真实性判别模块用于判断生成心电数据的真实性；

23、所述的心电数据类别判别模块，将向量l作为输入，生成输入为对应类别标签的概率dclass并作为输出；心电数据类别判别模块用于生成输入为对应类别标签的概率。

24、所述的判别器损失函数的设计方法如下：

25、c11：将真实心电数据r输入基于时空特征的判别器模型中，获得真实心电数据r的真实性概率输出source_real和类别概率输出class_real；再将class_real和真实心电数据r的标签输入交叉熵损失函数获得真实心电数据的类别损失class_error_real；

26、c12：随机采样产生均值为0、标准差为1的符合高斯分布的随机假心电数据s，对应的类别标签为noise_label；

27、c13：将随机假心电数据s输入基于自注意力机制的生成器，获得假心电数据fake_data；

28、c14：将假心电数据fake_data输入基于时空特征的判别器模型中，获得随机假心电数据s的真实性概率输出source_fake和类别概率输出class_fake，将真实性概率输出class_fake和类别标签noise_label输入交叉熵损失函数获得随机假心电数据的类别损失class_error_fake；

29、c15：判别器损失函数d_loss为：d_loss＝class_error_real+class_error_fake，结合adam优化器根据损失函数d_loss计算判别器参数的梯度，并进行参数更新。

30、所述的生成器损失函数的设计方法如下：

31、c21：将假心电数据fake_data再次输入基于时空特征的判别器模型，获得新的随机假心电数据s真实性概率输出source和类别概率输出class，将类别概率输出class和类别标签noise_label输入交叉熵损失函数获得随机假心电数据的类别损失class_error，计算真实性概率输出source的均值得到source_error；

32、c22：生成器损失函数g_loss为：g_loss＝class_error+source_error，结合adam优化器根据损失函数g_loss计算生成器参数的梯度，并进行参数更新。

33、所述的步骤d包括以下具体步骤：

34、d1：随机采样产生均值为0、标准差为1的符合高斯分布的随机假心电数据t，生成指定类别标签new_label；

35、d2：将随机假心电数据t和指定类别标签new_label进行拼接生成向量u，将向量u输入已训练基于自注意力机制的生成器，输出为指定类别标签的多导联心电数据，最终完成指定类别心电数据样本的扩充。

36、本发明通过引入辅助分类器生成对抗网络，能够根据特定的条件(如不同心律失常心电图心拍的类型/不同梗死病变位置心电图/不同梗死发病时期的心电图)直接生成符合条件的心电图数据。上述方法使让数据库中的先验知识参与到生成过程中，能够直接针对特定条件生成高度相关的心电图数据，显著提升数据生成的目标性和实用性。

37、本发明中，所采用的生成器包含长短期记忆网络(lstm)层、基于transformer的自注意力层和因果卷积层；其中，因果卷积层通过引入膨胀卷积扩大心电图数据的感受野，同时在进行卷积运算时只使用当前和过去的数据，不会引入未来的信息；lstm层能够捕捉心电图数据的复杂性，获取心拍采样点出现的时序特征；基于transformer的自注意力层通过注意力机制突出心电图数据中的关键特征，帮助模型聚焦于那些对分类或预测至关重要的信息，提高生成数据的精确度和相关性。

38、本发明在判别器中加入时空特征提取层，能够同时处理导联内心拍的动态变化和多个导联间的空间关系，从而准确判断生成心电数据的真实性，及时间序列特征的合理性，确保生成的心电图在时间上的连续性和逻辑性。