技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音宽动态范围压缩方法、装置、设备及存储介质与流程 > 正文

语音宽动态范围压缩方法、装置、设备及存储介质与流程

国知局
2024-06-21 11:40:38

本技术涉及语音信号处理，尤其是涉及一种语音宽动态范围压缩方法、装置、设备及存储介质。

背景技术：

1、助听器主要面向感音神经性听障患者，听障患者的听力障碍主要表现为听阈上升和听觉动态范围变窄。听阈上升，即能够感知的最小声强要比正常人高，并且不同频率处听阈上升的程度也不同，通常是高频部分上升的比较多；然而，听障患者的痛阈一般上升很小，或者可以认为不变，使得患者的听觉动态范围变窄。听障患者的听觉动态范围变窄的主要表现为，患者听不到细微的声音，或因为听不到声音的高频分量，造成能听到他人说话却不易听懂说话的内容。

2、针对听障患者听阈上升和听觉动态范围变窄的问题，需要对声音的响度进行补偿，将正常人听觉动态范围内的声音，“映射”到听障患者的听觉动态范围内，特别是对言语识别有重要影响的高频分量应当给予足够的补偿。

3、目前，较常采用单通道宽动态范围压缩(wide dynamic range compression，wdrc)算法实现响度补偿，在采用单通道wdrc算法对声音响度进行补偿时，一般采用快速压缩方法，即在强声时，增益快速下降，在弱声时，增益则快速上升。然而采用单通道wdrc方法会使得一些原本较小的背景噪声，在经过听力补偿后更加容易被感知。

技术实现思路

1、为了有助于解决单通道宽动态范围压缩方法会使得一些原本较小的背景噪声，在经过听力补偿后更加容易被感知的问题，本技术提供一种语音宽动态范围压缩方法、装置、设备及存储介质。

2、第一方面，本技术提供一种语音宽动态范围压缩方法，采用如下技术方案：所述方法应用于语音宽动态范围压缩系统，所述语音宽动态范围压缩系统包括助听器，所述方法包括：

3、获取待处理的语音信息，所述待处理的语音信息包括从所述助听器中获取的一段正常听力动态范围内的声音信息；

4、将所述待处理的语音信息转换成频域的语音信号，并分解成预设数量的通道信号；

5、对每个所述通道信号进行宽动态范围压缩处理后得到通道压缩信号；

6、将每个所述通道压缩信号合成全通道频域信号，并转换成时域语音信号后输出。

7、通过上述技术方案，由于听障患者在不同的频率处，听力损失的程度不同，通过将一路语音信号分解成多通道处理的方法，可以实现个性化听力补偿，在不同的通道上进行独立的压缩和放大，可以更好的拟合患者的听力曲线，满足不同频率的听力需求。此外，采用宽动态范围压缩处理方法可以对声音进行压缩放大，将正常人听力动态范围内的声音转换至听障者的听域范围内，并且尽可能地保证听觉的舒适和声音的清晰度，从而可以减少背景噪声在经过听力补偿后更容易被听障患者感知到的情况，进而使得听障患者在使用助听器听到正常人听见的声音时，尽可能减少被背景噪声所影响的情况。

8、在一个具体的可实施方案中，所述将所述待处理的语音信息转换成频域的语音信号，并分解成预设数量的通道信号包括：

9、将所述待处理的语音信息转换成频域表示，并获得语音频域信号；

10、将所述语音频域信号根据频域带宽均匀划分成若干语音子带信号；

11、根据bark尺度，将所述语音子带信号划分为预设数量的所述通道信号。

12、通过上述技术方案，考虑到人耳对声音频率高低的感觉与实际频率的高低不成线性关系，而近似成对数关系，利用线性频率到对数频率的映射，利用bark尺度划分，将频带划分到对应的通道上得到多通道信号。对多通道信号中的每个通道信号进行声音信号的处理，可以有助于减少背景噪声。

13、在一个具体的可实施方案中，所述对每个所述通道信号进行宽动态范围压缩处理后得到通道压缩信号包括：

14、计算每个所述通道信号的通道平均能量；

15、根据每个所述通道平均能量计算每个所述通道信号的通道输入声压级；

16、根据所述通道输入声压级计算每个所述通道信号的通道输出声压级；

17、根据所述通道输入声压级和所述通道输出声压级计算每个所述通道信号的通道增益；

18、将所述通道增益作用到所述通道信号，并生成所述通道压缩信号。

19、通过上述技术方案，采用宽动态范围压缩处理的方式对每个通道内的信号进行压缩处理后可以得到通道压缩信号。宽动态范围压缩听力补偿是助听器中语音处理技术的一种核心算法，宽动态范围压缩处理目的是对声音进行压缩放大，将正常人听力动态范围内的声音转换至听障者的听域范围内，并且尽可能地保证听觉的舒适和声音的清晰度，从而可以使得听障患者可以听见正常人可以听见的声音。

20、在一个具体的可实施方案中，所述根据所述通道输入声压级计算每个所述通道信号的通道输出声压级包括：

21、获取用于描述输入声压级和输出声压级对应关系的宽动态范围压缩曲线；

22、根据所述通道输入声压级查找对应于所述宽动态范围压缩曲线的输入区域；

23、根据所述输入区域的输入声压级和输出声压级的对应关系，计算得到所述通道输出声压级。

24、通过上述技术方案，宽动态范围压缩曲线是用于描述输入声压级和输出声压级对应关系的曲线图，不同的听障患者的真实听力情况会有所不同。为考虑到听障患者的真实听力情况以及环境噪声的影响，采用对低噪进行抑制的5段式曲线，可以对较低声压级以下的输入信号认为是底噪而加以抑制，从而可以减少噪声对听障患者听到外界声音的影响；其中，输入声压级表示正常人的听力声压级范围，输出声压级表示听障患者的声压级范围。

25、在一个具体的可实施方案中，在所述根据所述通道输入声压级和所述通道输出声压级计算每个所述通道信号的通道增益之后，还包括：

26、对计算得到的所述通道增益进行平滑滤波处理，并得到通道平滑增益；

27、所述将所述通道增益作用到所述通道信号，并生成所述通道压缩信号包括：

28、将所述通道平滑增益作用到所述通道信号，并生成所述通道压缩信号。

29、通过上述技术方案，若增益计算的结果波动较大会影响音质，因此对计算所得到的通道增益进行平滑滤波处理，可以降低增益计算结果的波动以及调整启动时间和释放时间，以减少计算结果的波动，从而可以提高经过处理后的语音信号的输出音质。

30、在一个具体的可实施方案中，所述通道信号包括若干语音子带信号，所述计算每个所述通道信号的通道平均能量包括：

31、计算若干所述语音子带信号的能量；

32、计算每个通道的所述通道信号的通道平均能量。

33、在一个具体的可实施方案中，所述通道输入声压级包括：

34、

35、第二方面，本技术提供一种语音宽动态范围压缩装置，采用如下技术方案：所述装置应用于语音宽动态范围压缩系统，所述语音宽动态范围压缩系统包括助听器，所述装置包括：

36、语音信息获取模块，用于获取待处理的语音信息，所述待处理的语音信息包括从所述助听器中获取的一段正常听力动态范围内的声音信息；

37、语音信息分解模块，用于将所述待处理的语音信息转换成频域的语音信号，并分解成预设数量的通道信号；

38、压缩处理模块，用于对每个所述通道信号进行宽动态范围压缩处理后得到通道压缩信号；

39、语音信息合成模块，用于将每个所述通道压缩信号合成全通道频域信号，并转换成时域语音信号后输出。

40、第三方面，本技术提供一种计算机设备，采用如下技术方案：包括存储器和处理器，所述存储器上存储有能够被处理器加载并执行如上述任一种语音宽动态范围压缩方法的计算机程序。

41、第四方面，本技术提供一种计算机可读存储介质，采用如下技术方案：存储有能够被处理器加载并执行上述任一种语音宽动态范围压缩方法的计算机程序。

42、综上所述，本技术具有以下有益技术效果：

43、由于听障患者在不同的频率处，听力损失的程度不同，通过将一路语音信号分解成多通道处理的方法，可以实现个性化听力补偿，在不同的通道上进行独立的压缩和放大，可以更好的拟合患者的听力曲线，满足不同频率的听力需求。此外，采用宽动态范围压缩处理方法可以对声音进行压缩放大，将正常人听力动态范围内的声音转换至听障者的听域范围内，并且尽可能地保证听觉的舒适和声音的清晰度，从而可以减少背景噪声在经过听力补偿后更容易被听障患者感知到的情况，进而使得听障患者在使用助听器听到正常人听见的声音时，尽可能减少被背景噪声所影响的情况。