技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种多噪声环境下的语音降噪系统的制作方法 > 正文

一种多噪声环境下的语音降噪系统的制作方法

国知局
2025-01-17 13:04:50

本发明涉及语音降噪，更具体地说，本发明涉及一种多噪声环境下的语音降噪系统。

背景技术：

1、语音降噪技术主要用于提高在噪声环境下的语音信号质量。随着通信技术和语音识别技术的广泛应用，人们对语音信号的质量要求也越来越高。然而，在实际应用中，语音信号通常会受到多种噪声源的干扰，例如环境噪声、背景音乐、交通噪声、工业噪声等，这些噪声会显著影响语音信号的清晰度与可理解度，给语音通信、语音识别和语音增强带来很大挑战。

2、目前，传统的语音降噪技术主要针对单一噪声源进行处理，但在实际环境中，语音信号往往同时受到多种噪声的干扰，这些噪声的频谱特征可能具有重叠或相似性，导致现有技术在多噪声环境下的降噪效果不理想。尤其是在复杂的多噪声环境中，单一的降噪方法往往难以有效抑制不同类型噪声对语音信号的干扰。

3、为了解决这一问题，近年来，越来越多的研究聚焦于多噪声环境下的语音降噪技术。通过多通道信号处理、深度学习、盲源分离等方法，能够更准确地识别和分离语音信号与多种噪声信号，从而达到更好的降噪效果。然而，这些方法仍面临着处理复杂性高以及对噪声处理适应性差等问题。因此，本发明提出一种多噪声环境下的语音降噪系统，以期通过划分合理的语音片段并且为之匹配准确的降噪策略来解决上述问题。

技术实现思路

1、为实现上述目的，本发明提供如下技术方案：

2、一种多噪声环境下的语音降噪系统，包括基础划分模块、合理性分析模块、优化标记模块、循环模块、降噪模块、重组模块；

3、基础划分模块用于获取输入的语音数据，并根据基础规则对语音数据进行切分，产生多个时长相同的语音片段，每个语音片段作为基础语音片段，作为后续处理的基本单位；

4、合理性分析模块通过分析相邻的基础语音片段，判断其切分的时间点是否合理；

5、优化标记模块用于当合理性分析模块检测到相邻的基础语音片段切分时间不合理时，优化标记模块用于在不合理的两个基础语音片段之间寻找优化标记点作为新的分割点，并进行分割操作得到两个优化语音片段，如果找不到优化标记点，则将两个相邻的基础语音片段得到一个优化语音片段；

6、循环模块用于通过合理性分析模块、优化标记模块对最新划分的优化语音片段结果进行循环验证合理性，直至最新划分的优化语音片段结果全部合理，得到循环确认后的全部降噪语音片段；

7、降噪模块用于对每一个降噪语音片段进行噪声特征、语音质量特征提取，分别得到噪声特征组和语音质量特征组，然后一同代入预先训练完成的降噪策略选择模型，根据降噪策略选择模型的输出结果选择对应的降噪策略进行降噪处理，得到降噪处理后的全部语音处理片段；

8、重组模块用于对全部语音处理片段进行重组，得到完整语音输出。

9、在一个优选的实施方式中，合理性分析模块分析相邻的基础语音片段指的是：

10、分析幅度变化，判断相邻片段切割点前后的幅度突变；

11、分析能量变化，判断切割点前后的能量差异；

12、分析信噪比变化，计算切割点前后信噪比的变化；

13、以及检验分析操作。

14、在一个优选的实施方式中，合理性分析模块使用时，获取相邻片段切割点前后的幅度突变差异绝对值、切割点前后的能量差异绝对值、切割点前后信噪比的差异绝对值；

15、相邻片段切割点的幅度突变差异绝对值大于等于预设的基准阈值一时生成异常信号，切割点前后的能量差异绝对值大于等于预设的基准阈值二时生成异常信号，切割点前后信噪比的差异绝对值大于等于预设的基准阈值三时生成异常信号；

16、检验分析操作指的是通过t检验判断两个窗口的噪声强度均值差异是否显著或通过卡方检验判断各噪声强度区间的频数分布是否显著不同，如果噪声强度均值差异显著或频数分布显著不同，则生成异常信号；

17、在一个优选的实施方式中，异常信号生成时，表示切分的时间点合理。

18、在不合理的两个基础语音片段之间寻找优化标记点作为新的分割点时，探究每一个切分时间点前后对应的幅度变化、能量变化以及信噪比变化，并将这三项变化的烈度进行汇总，生成变化剧烈指数，然后将变化剧烈指数最大值对应的切分时间点作为备选标记点，将备选标记点的变化剧烈指数与预设的变化剧烈阈值进行对比，如果备选标记点的变化剧烈指数大于预设的变化剧烈阈值，则将备选标记点转为优化标记点，如果备选标记点的变化剧烈指数小于等于预设的变化剧烈阈值，则将备选标记点舍弃即找不到优化标记点。

19、在一个优选的实施方式中，变化剧烈指数的生成公式为：

20、；

21、、、均为预设的非零比例系数，、、均为预设的调控每个差异项影响的非零调节系数，为预设的非零常数，为变化剧烈指数，为切割点前后片段的平均幅度差值的绝对值，为切割点前后片段的能量差值的绝对值，为切割点前后片段的信噪比差值的绝对值。

22、在一个优选的实施方式中，噪声特征组包含噪声频谱特征、噪声能量特征、噪声波形特征。

23、在一个优选的实施方式中，语音质量特征组包含语音长度特征、语音质量指数特征。

24、在一个优选的实施方式中，语音质量指数的获取逻辑为：

25、获取降噪语音片段的短时信噪比平均值、瞬时清晰度平均值，以及频谱熵平均值，然后进行加权求和，得到降噪语音片段对应的语音质量指数。

26、在一个优选的实施方式中，降噪策略选择模型为卷积神经网络模型。

27、本发明的技术效果和优点：

28、传统的语音降噪方法通常将整个语音信号作为一个整体进行处理，这种处理方式容易导致在噪声类型变化较大的场景中，降噪效果不稳定或出现过度降噪（即语音信号失真）。而本发明通过将整体语音信号划分为多个较小的语音片段，使得每个片段能够根据其独特的噪声特征采用个性化的降噪策略。具体来说，某些语音片段可能包含较强的背景噪声或有较复杂的噪声源，而其他片段可能相对干净或噪声较少。通过对这些片段进行针对性的处理，可以最大程度地减少噪声对语音信号的干扰，提高语音信号的清晰度和可懂度。

29、多噪声环境中的语音信号常常受到多种噪声源的干扰，这些噪声源可能在不同时间段或不同频段有不同的强度和特征。通过将语音信号划分为多个片段，本发明能够根据每个片段的噪声特征，为其匹配最合适的降噪算法。不同片段的降噪策略匹配，能够显著提高整体语音的清晰度和可懂度。本发明通过分析语音的变化特性，合理划分语音片段，使得每个片段的边界切合实际复杂环境下的变化。合理的划分策略能够确保后续的降噪算法在处理每个片段时，能够精准地聚焦于目标噪声源，避免误伤语音信号本身。在实际应用中，这种精确的片段划分会显著减少“伪噪声”的产生，使得降噪后的语音更加自然、流畅，同时也避免了因过度降噪而引起的语音失真或模糊。

30、在实际噪声环境中，噪声通常是动态变化的，传统的降噪方法往往使用固定的参数和策略，这可能无法适应快速变化的噪声环境。而本发明通过对语音片段的划分和动态分析，可以实时评估每个片段的噪声特征，并自动调整降噪策略。通过动态适配的降噪策略，本发明能够应对更加复杂且不稳定的噪声环境，确保语音质量在各种场景下都得到较好的提升。

31、将语音信号划分为多个片段后，系统可以在每个片段内分别应用不同的降噪算法，这不仅提高了降噪精度，还能够避免对整个语音信号的过度计算。通过针对性的片段处理，可以有效减少不必要的计算量，降低系统的计算复杂度，使得在资源有限的设备（如移动设备、嵌入式系统）上也能高效运行。