技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于多特征融合优化的病理嗓音多分类算法 > 正文

一种基于多特征融合优化的病理嗓音多分类算法

国知局
2024-10-21 14:32:10

本发明属于计算机信息处理和医学病理嗓音交叉，尤其涉及一种基于多特征融合优化的病理嗓音多分类算法。

背景技术：

1、随着人类社会交流的增加和生活习惯的改变，嗓音疾病的发生率越来越高，因此临床上对言语嗓音障碍的检测和评估越来越重视。病理嗓音是因发声系统病变而产生的语音，发声系统发生病变会引起语音信号声学特征的改变，而通过声学信号处理技术对病理嗓音进行分析检测以实现对其病因类型的诊断具有非入侵性、客观性和便利性的优势特点，因而基于病理嗓音的诊断分析已经成为了当前的研究热点。然而由于发声系统结构的复杂性、临床诊断的侵入性、医生判断主观性等诸多问题，致使现有的嗓音疾病病因的诊断算法复杂度高、准确率低。

2、因此，亟需一种算法简单、准确率高且容易诊断的病理嗓音多分类算法。

技术实现思路

1、为解决现有技术的缺点和不足，提供一种基于多特征融合优化的病理嗓音多分类算法，从而可解决现有嗓音疾病病因诊断算法存在嗓音信号的声学特征描述符数据不均衡、诊断算法复杂度高、诊断准确率低的问题。

2、为实现本发明目的而提供的一种基于多特征融合优化的病理嗓音多分类算法，包括有如下步骤：

3、步骤一：基于meei数据库数据集，从嗓音信号的时间域、频率域、基频扰动性、振幅扰动性和音质五个方面出发，从而对应计算得出基频to、低频振幅调整频率fatr、绝对频率扰动jita、平滑振幅扰动商sapq、噪声谐波比nhr五种声学特征描述符；

4、步骤二：对步骤一中得到的基频to、低频振幅调整频率fatr、绝对频率扰动jita、平滑振幅扰动商sapq、噪声谐波比nhr五种声学特征描述符进行增广均衡处理；

5、步骤三：对步骤二进行增广均衡处理后的五种声学特征描述符进行多特征融合优化；

6、步骤四：对步骤三进行多特征融合优化后的五种声学特征描述符基于随机森林分类器进行测试和验证，进而得出多特征融合优化在病理嗓音分类任务中的有效性和准确性。

7、作为上述方案的进一步改进，所述步骤一中基频to的计算公式为：

8、

9、其中，τ是延迟，x(t)是嗓音信号，n是信号长度，基频to是自相关函数r(τ)的第一个最大值对应的延迟。

10、作为上述方案的进一步改进，所述步骤一中低频振幅调整频率fatr的计算公式为：

11、

12、其中，是嗓音信号的希尔伯特变换，表示傅里叶变换，fmax是低频范围的上限。

13、作为上述方案的进一步改进，所述步骤一中绝对频率扰动jita的计算公式为：

14、

15、其中，ti第i个基音周期，n是总的基音周期数。

16、作为上述方案的进一步改进，所述步骤一中平滑振幅扰动商sapq的计算公式为：

17、

18、其中，ai是第i个周期的振幅，num代表连续周期数目。

19、作为上述方案的进一步改进，所述步骤一中噪声谐波比nhr的计算公式为：

20、

21、其中，enoise是噪声能量，eharmonics是谐波能量。

22、作为上述方案的进一步改进，所述步骤二中进行增广均衡处理的具体步骤如下：

23、s2.1.预设增广均衡数目num0,预设变量num为0；

24、s2.2.从步骤一得到的五种声学特征描述符中均选择出一个少数类特征描述符样本作为种子样本；

25、s2.3.确定s2.1得到的种子样本是否为边界样本xi，其具体步骤如下：计算种子样本与所有非种子样本的欧氏距离，使用k-近邻算法找到种子样本的最近k个邻居，计算种子样本最近k个邻居中多数类样本的数目，当多数类样本的数目大于等于k/2时，则种子样本为边界样本xi；

26、s2.4.对于每个边界样本xi，从边界样本xi最近的少数类邻居中随机选择一个样本xj，使用线性插值生成新样本newsample，计算公式为：

27、new sample＝xi+λ×(xj-xi)

28、其中，λ是介于0到1之间的随机数，目的是为了对所有插值生成的新样本newsample进行随机扰动以进一步增加数据的多样性；

29、s2.5.将生成的新样本new sample添加到步骤一计算的到基频to、低频振幅调整频率fatr、绝对频率扰动jita、平滑振幅扰动商sapq、噪声谐波比nhr五种声学特征描述符数据中，形成新的五种声学特征描述符，同时将预设的变量num加1；

30、s2.6.判断s2.5得到新的五种声学特征描述符中增广均衡数目num是否满足预设的增广均衡数目num0；当满足时，终止计算；当不满足时，重复s2.2-s2.5，直至满足。

31、作为上述方案的进一步改进，所述步骤三中进行多特征融合优化的过程为：选定步骤二进行增广均衡处理后的五种声学特征描述符数据进行矩阵连接，从而完成融合优化处理；矩阵连接可选择水平连接或者垂直连接：水平连接是将多个矩阵在列方向上拼接起来，即在原有矩阵的右侧追加新矩阵的列；垂直连接是将多个矩阵在行方向上拼接起来，即在原有矩阵的下方追加新矩阵的行。

32、本发明的有益效果是：

33、与现有技术相比，本发明提供的一种基于多特征融合优化的病理嗓音多分类算法，基于meei数据库的嗓音信号，从时间域、频率域、基频扰动性、振幅扰动性、音质五个角度出发，通过计算基频to、低频振幅调整频率fatr、绝对频率扰动jita、平滑振幅扰动商sapq、噪声谐波比nhr五种声学特征描述符，达到了在降低嗓音信号声学特征描述符维度的同时，全方位获取嗓音信号多维度声学特性的目的，在一定程度上减少了辨别能力弱的声学特征描述符所带来的不必要的工作量，解决了现有嗓音疾病病因诊断算法存在声学特征描述符维度大、复杂度高的问题；通过对五种声学特征描述符进行增广均衡处理，达到了保证病理嗓音信号声学特征描述符数据的平衡性，为后续病理嗓音多分类研究提供了数据支持，解决了现有病理嗓音信号声学特征描述符数据不均衡的问题；通过对增广均衡处理后的声学特征描述符数据进行融合处理，达到了提高嗓音疾病病因诊断器的性能，实验表明多特征融合优化在随机森林分类器下针对四种嗓音疾病病因诊断达到了86.17％的准确率，解决了现有嗓音疾病病因诊断算法存在准确率低的问题；另外基于四类病理嗓音信号，通过测试单个特征、两个特征、三个特征、四个特征和五个特征描述符在随机森林分类器下不同组合情况的分类效果，达到提高模型的稳健性并减少了过拟合风险的目的，86.17％的准确率也验证了多特征融合优化算法在嗓音疾病病因诊断任务中的有效性和准确性。

技术特征：

1.一种基于多特征融合优化的病理嗓音多分类算法，其特征在于：包括有如下步骤：

2.根据权利要求1所述的一种基于多特征融合优化的病理嗓音多分类算法，其特征在于：所述步骤一中基频to的计算公式为：

3.根据权利要求1所述的一种基于多特征融合优化的病理嗓音多分类算法，其特征在于：所述步骤一中低频振幅调整频率fatr的计算公式为：

4.根据权利要求1所述的一种基于多特征融合优化的病理嗓音多分类算法，其特征在于：所述步骤一中绝对频率扰动jita的计算公式为：

5.根据权利要求1所述的一种基于多特征融合优化的病理嗓音多分类算法，其特征在于：所述步骤一中平滑振幅扰动商sapq的计算公式为：

6.根据权利要求1所述的一种基于多特征融合优化的病理嗓音多分类算法，其特征在于：所述步骤一中噪声谐波比nhr的计算公式为：

7.根据权利要求1所述的一种基于多特征融合优化的病理嗓音多分类算法，其特征在于：所述步骤二中进行增广均衡处理的具体步骤如下：

8.根据权利要求1所述的一种基于多特征融合优化的病理嗓音多分类算法，其特征在于：所述步骤三中进行多特征融合优化的过程为：选定步骤二进行增广均衡处理后的五种声学特征描述符数据进行矩阵连接，从而完成融合优化处理；矩阵连接可选择水平连接或者垂直连接：水平连接是将多个矩阵在列方向上拼接起来，即在原有矩阵的右侧追加新矩阵的列；垂直连接是将多个矩阵在行方向上拼接起来，即在原有矩阵的下方追加新矩阵的行。

技术总结本发明公开了一种基于多特征融合优化的病理嗓音多分类算法，基于MEEI数据库的嗓音信号，从时间域、频率域、基频扰动性、振幅扰动性、音质五个角度出发，通过计算五种声学特征描述符，达到了在降低嗓音信号声学特征描述符维度的同时，全方位获取嗓音信号多维度声学特性的目的，在一定程度上减少了辨别能力弱的声学特征描述符所带来的不必要的工作量；通过对五种声学特征描述符进行增广均衡处理，达到了保证病理嗓音信号声学特征描述符数据的平衡性，解决了现有病理嗓音信号声学特征描述符数据不均衡的问题；通过对增广均衡处理后的声学特征描述符数据进行融合处理，达到了提高嗓音疾病病因诊断器的性能。技术研发人员：武雅琴,张佳庆,赵佳玮,张舒骜受保护的技术使用者：山西农业大学技术研发日：技术公布日：2024/10/17