一种基于深度学习的肠鸣音实时检测方法及系统
- 国知局
- 2024-06-21 10:40:47
本发明涉及生理信号检测,特别涉及一种基于深度学习的肠鸣音实时检测方法及系统。
背景技术:
1、基于深度学习的声事件检测(sound event detection)技术是自然语言处理的一个重要分支,通过深度学习技术将一段声学音频中某一时间范围的特定声事件进行自动化分割,目前正被逐渐应用于智能音箱、智慧城市、智慧医疗等领域,具有广阔的发展潜力。
2、肠鸣音(bowel sounds,bs)是胃肠蠕动过程中所产生的一种声学信号,可视为一种生物声事件。肠鸣音的发生次数、音调、持续时间等可以反应病患的胃肠功能状态,对胃肠功能疾病具有重大的指导意义。
3、一般来讲,肠梗阻患者的肠鸣音次数较高而肠麻痹患者的肠鸣音次数则较低,且二者在音调、音色等方面存在差异。医疗领域中,传统的肠鸣音的监测一般是人工听诊的方式,即有经验的医师采用听诊器进行监听,存在着可复现性差、主观影响大等缺点。随着电子工业的进步,肠鸣音监听的数字化开始兴起,因此产生了大量包含肠鸣音的音频数据,这导致肠鸣音的自动化检测成为肠鸣音数字化诊疗的首要任务。由于肠鸣音采集过程中受呼吸声、说话声、衣物摩擦声干扰,导致肠鸣音易被淹没;同时基于传统信号处理、机器学习的分割方法存在着拟合能力弱、虚警高、对阈值敏感等问题。
技术实现思路
1、本发明提供了一种基于深度学习的肠鸣音实时检测方法及系统,以解决现有的肠鸣音检测方法所存在的拟合能力弱、虚警高、对阈值敏感的技术问题。
2、为解决上述技术问题,本发明提供了如下技术方案:
3、一方面,本发明提供了一种基于深度学习的肠鸣音实时检测方法,包括:
4、获取待检测的肠鸣音原始信号;其中,所述原始信号为一维音频信号;
5、使用对数梅尔能量谱作为特征提取方法,采用梅尔频率变换模拟人耳听觉效果,从所述原始信号中提取得到所述原始信号对应的对数梅尔能量谱;
6、将所述对数梅尔能量谱输入预设的深度学习模型,得到肠鸣音预测概率分布;
7、基于肠鸣音预测概率分布,计算得到所述原始信号中的肠鸣音产生的次数。
8、进一步地,所述深度学习模型为基于卷积和双向gru结合的深度学习模型;
9、所述深度学习模型包含一维卷积模块、双向gru模块和全连接层;其中,所述一维卷积模块包含2层一维卷积层,用于实现对对数梅尔能量谱的时频域关联的特征提取;所述双向gru模块包含3层双向gru层,用于从所述一维卷积模块提取的特征中提取肠鸣音发生前后时间关联的特征;所述全连接层用于将所述双向gru模块提取到的特征进行维度转换,得到肠鸣音预测概率分布。
10、进一步地,深度学习模型的目标函数为基于huber损失和shape损失的损失函数;其中,huber损失结合了l1损失和mse损失的优势;shape损失利用预测概率分布的形状特征,计算肠鸣音片段的平均值α1和方差σ1,以及背景噪声片段的平均值α2和方差σ2,计算(α1-α)1+(σ1+σ2)作为shape损失,以拉大肠鸣音和背景噪声的预测概率差异,减小肠鸣音连续预测的波动性,使预测概率分布更加接近于真实概率分布,提升分割精度同时降低模型对阈值的敏感性。
11、进一步地,基于肠鸣音预测概率分布,计算得到所述原始信号中的肠鸣音产生的次数,包括:
12、设定阈值t和参数p;
13、对肠鸣音预测概率分布进行统计,将大于阈值t且连续的预测点集记为1次肠鸣音,以此得到所述原始信号中的肠鸣音事件次数n;依据参数p将n个肠鸣音事件中预测点集个数小于p的事件进行去除,得到最终的肠鸣音次数。
14、另一方面,本发明还提供了一种基于深度学习的肠鸣音实时检测系统,包括:
15、肠鸣音分割模块,用于:
16、获取待检测的肠鸣音原始信号;其中,所述原始信号为一维音频信号;
17、使用对数梅尔能量谱作为特征提取方法,采用梅尔频率变换模拟人耳听觉效果,从所述原始信号中提取得到所述原始信号对应的对数梅尔能量谱;
18、将所述对数梅尔能量谱输入预设的深度学习模型,得到肠鸣音预测概率分布;
19、后处理模块,用于:
20、基于肠鸣音预测概率分布,计算得到所述原始信号中的肠鸣音产生的次数。
21、进一步地,所述深度学习模型为基于卷积和双向gru结合的深度学习模型;
22、所述深度学习模型包含一维卷积模块、双向gru模块和全连接层;其中,所述一维卷积模块包含2层一维卷积层,用于实现对对数梅尔能量谱的时频域关联的特征提取;所述双向gru模块包含3层双向gru层,用于从所述一维卷积模块提取的特征中提取肠鸣音发生前后时间关联的特征;所述全连接层用于将所述双向gru模块提取到的特征进行维度转换,得到肠鸣音预测概率分布。
23、进一步地,深度学习模型的目标函数为基于huber损失和shape损失的损失函数;其中,huber损失结合了l1损失和mse损失的优势;shape损失利用预测概率分布的形状特征,计算肠鸣音片段的平均值α1和方差σ1,以及背景噪声片段的平均值α2和方差σ2,计算(α1-α2)+(σ1+σ2)作为shape损失,以拉大肠鸣音和背景噪声的预测概率差异,减小肠鸣音连续预测的波动性,使预测概率分布更加接近于真实概率分布,提升分割精度同时降低模型对阈值的敏感性。
24、进一步地,所述后处理模块具体用于:
25、设定阈值t和参数p;
26、对肠鸣音预测概率分布进行统计,将大于阈值t且连续的预测点集记为1次肠鸣音,以此得到所述原始信号中的肠鸣音事件次数n;依据参数p将n个肠鸣音事件中预测点集个数小于p的事件进行去除,得到最终的肠鸣音次数。
27、再一方面,本发明还提供了一种电子设备,其包括处理器和存储器;其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现上述方法。
28、又一方面,本发明还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现上述方法。
29、本发明提供的技术方案带来的有益效果至少包括:
30、本发明的技术方案可以降低肠鸣音分割模型对阈值设置的敏感性、降低预测概率分布的波动性、虚警率并提高鲁棒性,对肠鸣音分割结果的精度有较明显的提升,而且本发明的技术方案中的肠鸣音分割模型的轻量化设计使得其具有更好的实时计算能力,可用于不同实验对象的肠鸣音实时检测,泛化能力强。
技术特征:1.一种基于深度学习的肠鸣音实时检测方法,其特征在于,包括:
2.如权利要求1所述的基于深度学习的肠鸣音实时检测方法,其特征在于,所述深度学习模型为基于卷积和双向门控循环单元gru结合的深度学习模型;
3.如权利要求2所述的基于深度学习的肠鸣音实时检测方法,其特征在于,所述深度学习模型的目标函数为基于huber损失和shape损失的损失函数;其中,huber损失结合了l1损失和mse损失的优势;shape损失利用预测概率分布的形状特征,计算肠鸣音片段的平均值α1和方差σ1,以及背景噪声片段的平均值α2和方差σ2,计算(α1-α2)+(σ1+σ2)作为shape损失,以拉大肠鸣音和背景噪声的预测概率差异,减小肠鸣音连续预测的波动性,使预测概率分布更加接近于真实概率分布,提升分割精度同时降低模型对阈值的敏感性。
4.如权利要求1所述的基于深度学习的肠鸣音实时检测方法,其特征在于,基于肠鸣音预测概率分布,计算得到所述原始信号中的肠鸣音产生的次数,包括:
5.一种基于深度学习的肠鸣音实时检测系统,其特征在于,包括:
6.如权利要求5所述的基于深度学习的肠鸣音实时检测系统,其特征在于,所述深度学习模型为基于卷积和双向gru结合的深度学习模型;
7.如权利要求6所述的基于深度学习的肠鸣音实时检测系统,其特征在于,所述深度学习模型的目标函数为基于huber损失和shape损失的损失函数;其中,huber损失结合了l1损失和mse损失的优势;shape损失利用预测概率分布的形状特征,计算肠鸣音片段的平均值α1和方差σ1,以及背景噪声片段的平均值α2和方差σ2,计算(α1-α)1+(σ1+σ2)作为shape损失,以拉大肠鸣音和背景噪声的预测概率差异,减小肠鸣音连续预测的波动性,使预测概率分布更加接近于真实概率分布,提升分割精度同时降低模型对阈值的敏感性。
8.如权利要求5所述的基于深度学习的肠鸣音实时检测系统,其特征在于,所述后处理模块具体用于:
技术总结本发明公开了一种基于深度学习的肠鸣音实时检测方法及系统,该方法包括:获取待检测的肠鸣音原始信号;其中,所述原始信号为一维音频信号;使用对数梅尔能量谱作为特征提取方法,采用梅尔频率变换模拟人耳听觉效果,从所述原始信号中提取得到所述原始信号对应的对数梅尔能量谱;将所述对数梅尔能量谱输入预设的深度学习模型,得到肠鸣音预测概率分布;基于肠鸣音预测概率分布,计算得到所述原始信号中的肠鸣音产生的次数。使用本发明的技术方案,不仅可实现肠鸣音的自动化分割,而且在得到肠鸣音分割片段后通过后处理还可得到肠鸣音次数,从而为临床辅助诊断提供更加全面的数据支撑。技术研发人员:阳建宏,冷玉鑫,张明远,崔潇,黎敏,何鑫磊受保护的技术使用者:北京科技大学技术研发日:技术公布日:2024/1/22本文地址:https://www.jishuxx.com/zhuanli/20240618/21148.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表