技术新讯 > 乐器声学设备的制造及制作,分析技术 > 基于双向长短期记忆网络和多头注意力机制的心音分类方法  >  正文

基于双向长短期记忆网络和多头注意力机制的心音分类方法

  • 国知局
  • 2024-06-21 11:51:18

本发明涉及一种基于双向长短期记忆网络和多头注意力机制的心音分类方法,属于心音分类。

背景技术:

1、世界卫生组织的统计数据表明,心血管疾病的致死率近几年来一直居于各类疾病的首位。心音是由心脏肌群收缩、瓣膜开合和血液流动碰撞心脏壁引发的机械性振动而产生的声音,能够反映心房、心室、瓣膜、动脉血管壁等结构的工作状况。心音听诊在心血管疾病的早期筛查中是最为经济有效的诊断方法之一,被广泛应用于临床诊断,但心音听诊结果往往依赖于医务人员的听诊经验和诊断水平,受主观因素影响较大。

2、识别准确率的提高一直是心音分类的一个永恒主题。基于传统机器学习的心音分类方法先通过人工设计并提取的心音特征,再采用基于支持向量机、随机森林、隐马尔可夫模型等分类器实现心音分类,然而针对各种环境下不同病理的心音,人工设计并筛选有效的心音特征异常困难。

3、近年来,基于卷积神经网络和循环神经网络的心音分类方法取得了良好的分类效果,但对于心音时间序列,卷积神经网络和循环神经网络并不能充分捕捉到对分类结果至关重要的鉴别性特征,导致心音分类准确率较低。

4、上述问题是在基于双向长短期记忆网络和多头注意力机制的心音分类过程中应当予以考虑并解决的问题。

技术实现思路

1、本发明的目的是提供一种基于双向长短期记忆网络和多头注意力机制的心音分类方法解决现有技术中存在的心音分类准确率有待提高的问题。

2、本发明的技术解决方案是:

3、一种基于双向长短期记忆网络和多头注意力机制的心音分类方法,包括以下步骤,

4、s1、对原始心音信号进行滤波和切分处理,得到处理后的心音信号;

5、s2、提取处理后的心音信号的梅尔频率倒谱系数特征序列即mfcc特征序列,将mfcc特征序列按设定比例划分为训练样本与测试样本,由训练样本与对应的心音类别标签构成训练集;

6、s3、构建基于双向长短期记忆网络和多头注意力机制心音分类网络模型,基于双向长短期记忆网络和多头注意力机制心音分类网络模型包括双向长短期记忆网络层、多头注意力层和分类器,将mfcc特征序列输入由双向长短期记忆网络后输出特征矩阵,通过多头注意力机制关注双向长短期记忆网络输出的特征矩阵,得到新的心音特征矩阵,最后由分类器获得分类结果;

7、s4、利用训练集对基于双向长短期记忆网络和多头注意力机制心音分类网络模型进行训练,并将训练后的模型参数进行保存;

8、s5、使用训练后的基于双向长短期记忆网络和多头注意力机制心音分类网络模型对测试样本进行测试,得到最终分类识别结果。

9、进一步地,步骤s3中,将mfcc特征序列输入由双向长短期记忆网络后输出特征矩阵,通过多头注意力机制关注双向长短期记忆网络输出的特征矩阵,得到新的心音特征矩阵,具体为,

10、s31、使用双向长短期记忆网络即bi-lstm网络提取mfcc特征序列x的上下文特征,输出特征矩阵y;

11、s32、多头注意力层对特征矩阵y进行注意力分数计算并加权求和,得到新的心音特征矩阵z。

12、进一步地,步骤s32中,多头注意力层对特征矩阵y进行注意力分数计算并加权求和,得到新的心音特征矩阵z,具体为,

13、s321、构建注意力矩阵,并构建用于从多个子空间捕获信息的并行注意力头headi;

14、s322、构建多头注意力机制得到新的心音特征矩阵z:z=multihead(q,k,v)=concat(head1,…,headh)wo,式中,multihead(q,k,v)是多头注意力机制的计算值,concat(·)是连接操作函数,head1,...,headh是第1-h并行注意力头,wo是线性输出函数权重矩阵。

15、进一步地,步骤s321中,构建注意力矩阵,计算公式为:式中,attention(q,k,v)是注意力矩阵的计算值,softmax(·)是softmax分类器函数,q是查询矩阵,k是键矩阵,v是值矩阵,t是转置运算符,d是bi-lstm网络的隐藏层神经元数量。

16、进一步地,步骤s321中,构建用于从多个子空间捕获信息的并行注意力头headi:headi=attention(qwiq,kwik,vwiv),式中,i是并行注意力头索引,attention(·)是注意力矩阵的计算函数,q是查询矩阵,k是键矩阵,v是值矩阵,是查询预测权重矩阵,是键预测权重矩阵,是值预测权重矩阵。

17、进一步地,基于双向长短期记忆网络和多头注意力机制心音分类网络模型中,由分类器获得分类结果,具体为,分类器采用全连接层对多头注意力层的输出进行维度变换,连接到2个节点,每个节点对应一种心音类别,经过softmax函数后得到一个2维向量,2维向量中每一个维度的数值代表属于对应心音类别的预测概率,获得分类结果。

18、本发明的有益效果是:该种基于双向长短期记忆网络和多头注意力机制的心音分类方法,通过采用双向长短期记忆网络能够充分提取心音信号上下文特征,挖掘心音序列特征内部的关联信息,使得比传统的心音分类方法具有更高的分类准确率。本发明利用多头注意力机制自动关注双向长短期记忆网络重要时间步输出的特征信息,从而能够捕获鉴别力更强的特征,进一步提高心音分类的准确率和鲁棒性。

技术特征:

1.一种基于双向长短期记忆网络和多头注意力机制的心音分类方法,其特征在于:包括以下步骤,

2.如权利要求1所述的基于双向长短期记忆网络和多头注意力机制的心音分类方法,其特征在于:步骤s3中,将mfcc特征序列输入由双向长短期记忆网络后输出特征矩阵,通过多头注意力机制关注双向长短期记忆网络输出的特征矩阵,得到新的心音特征矩阵,具体为,

3.如权利要求1或2所述的基于双向长短期记忆网络和多头注意力机制的心音分类方法,其特征在于:步骤s32中,多头注意力层对特征矩阵y进行注意力分数计算并加权求和,得到新的心音特征矩阵z,具体为,

4.如权利要求3所述的基于双向长短期记忆网络和多头注意力机制的心音分类方法,其特征在于:步骤s321中,构建注意力矩阵,计算公式为:式中,attention(q,k,v)是注意力矩阵的计算值,softmax(·)是softmax分类器函数,q是查询矩阵,k是键矩阵,v是值矩阵,t是转置运算符,d是bi-lstm网络的隐藏层神经元数量。

5.如权利要求3所述的基于双向长短期记忆网络和多头注意力机制的心音分类方法,其特征在于:步骤s321中,构建用于从多个子空间捕获信息的并行注意力头headi:headi=attention(qwiq,kwik,vwiv),式中,i是并行注意力头索引,attention(·)是注意力矩阵的计算函数,q是查询矩阵,k是键矩阵,v是值矩阵,wiq是查询预测权重矩阵,wik是键预测权重矩阵,wiv是值预测权重矩阵。

6.如权利要求1或2所述的基于双向长短期记忆网络和多头注意力机制的心音分类方法,其特征在于:基于双向长短期记忆网络和多头注意力机制心音分类网络模型中,由分类器获得分类结果,具体为,分类器采用全连接层对多头注意力层的输出进行维度变换,连接到2个节点,每个节点对应一种心音类别,经过softmax函数后得到一个2维向量,2维向量中每一个维度的数值代表属于对应心音类别的预测概率,获得分类结果。

技术总结本发明提供一种基于双向长短期记忆网络和多头注意力机制的心音分类方法,对原始心音信号进行滤波和切分处理,得到处理后的心音信号;提取处理后的心音信号的MFCC特征序列,将MFCC特征序列按设定比例划分为训练样本与测试样本,由训练样本与对应的心音类别标签构成训练集;构建基于双向长短期记忆网络和多头注意力机制心音分类网络模型,包括双向长短期记忆网络层、多头注意力层和分类器;对基于双向长短期记忆网络和多头注意力机制心音分类网络模型进行训练;使用训练后的基于双向长短期记忆网络和多头注意力机制心音分类网络模型对测试样本进行测试,得到最终分类识别结果。该方法利用双向长短期记忆网络提取心音信号的上下文特征,利用多头注意力机制自动关注双向长短期记忆网络重要时间步输出的特征信息,能够提高心音分类的准确性和鲁棒性。技术研发人员:李齐健受保护的技术使用者:南京邮电大学技术研发日:技术公布日:2024/5/12

本文地址:https://www.jishuxx.com/zhuanli/20240618/23999.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。