技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音降噪方法、装置、电子设备及存储介质与流程 > 正文

语音降噪方法、装置、电子设备及存储介质与流程

国知局
2024-06-21 11:44:04

本技术涉及语音降噪，尤其涉及一种语音降噪方法、装置、电子设备及存储介质。

背景技术：

1、随着科技的发展，人们对高质量音频的需求日益增长，尤其是在移动通信、语音识别、视频会议等领域。然而，由于各种原因，如环境噪声、设备噪声等，原始语音信号中常常混有噪声，严重影响了语音的质量和可理解性。

2、现有的较为精细的降噪方式为基于深度学习的降噪方法，基于深度学习的降噪模型需要利用大量的样本训练，来保证语音降噪效果。但是，在多噪音场景的实际应用中往往没有大量的多噪音样本供模型训练，从而会影响多噪音场景中的语音降噪效果。

技术实现思路

1、基于上述需求，本技术提出一种语音降噪方法、装置、电子设备及存储介质，能够提高多噪音场景中的语音降噪效果。

2、为实现上述目的，本技术提出如下技术方案：

3、根据本技术实施例的第一方面，提供了一种语音降噪方法，包括：

4、根据待降噪语音的语音单元的噪音特征，对所述待降噪语音进行片段划分，得到语音片段；所述语音单元包括第一预设数量的连续语音帧；所述语音片段包括至少一个语音单元，且同一语音片段中的相邻语音单元的噪音特征相似度达到预设阈值；

5、根据所述语音片段中的语音单元的噪音特征，从预设的降噪策略库中，确定出与所述语音片段对应的降噪处理策略，所述降噪处理策略包括至少一种语音降噪处理方法；

6、按照所述降噪处理策略，对所述语音片段进行降噪处理。

7、可选的，根据所述语音片段中的语音单元的噪音特征，从预设的降噪策略库中，确定出与所述语音片段对应的降噪处理策略，包括：

8、根据所述语音片段中的语音单元的噪音特征和预设的降噪策略库中各个噪音场景对应的样本噪音特征，确定与所述语音片段相匹配的目标噪音场景；

9、从预设的降噪策略库中查询语音片段相匹配的目标噪音场景对应的降噪处理策略，作为所述语音片段对应的降噪处理策略。

10、可选的，根据待降噪语音的语音单元的噪音特征，对所述待降噪语音进行片段划分，得到语音片段，包括：

11、依次遍历待降噪语音中的语音单元；

12、基于遍历到的当前语音单元的噪音特征与所述当前语音单元的上一语音单元的噪音特征，将所述当前语音单元划分至所述上一语音单元所属的第一语音片段，或者，将所述当前语音单元划分至第二语音片段。

13、可选的，基于遍历到的当前语音单元的噪音特征与所述当前语音单元的上一语音单元的噪音特征，将所述当前语音单元划分至所述上一语音单元所属的第一语音片段，或者，将所述当前语音单元划分至第二语音片段，包括：

14、基于遍历到的当前语音单元的噪音特征与所述当前语音单元的上一语音单元的噪音特征，判断所述当前语音单元是否符合预设划分条件；

15、若所述当前语音单元不符合划分预设条件，则将所述当前语音单元划分到第二语音片段，所述第二语音片段为所述上一语音单元所属的第一语音片段的下一个语音片段；

16、若所述当前语音单元符合划分预设条件，则将所述当前语音单元划分到所述上一语音单元所属的第一语音片段；

17、其中，所述划分预设条件包括：第一划分条件和第二划分条件；所述第一划分条件包括：所述当前语音单元与所述上一语音单元之间的噪音特征相似度达到预设阈值，或，所述上一语音单元的噪音特征为空；所述第二划分条件包括：所述上一语音单元所属的第一语音片段中未达到第二预设数量的语音帧。

18、可选的，根据所述语音片段中的语音单元的噪音特征和预设的降噪策略库中各个噪音场景对应的样本噪音特征，确定与所述语音片段相匹配的目标噪音场景，包括：

19、根据所述语音片段中各个语音单元的噪音特征和预设的降噪策略库中各个噪音场景对应的样本噪音特征，确定所述语音片段中各个语音单元匹配的噪音场景，并将所述语音片段中所有语音单元匹配的噪音场景组成所述语音片段对应的噪音场景序列；

20、将所述噪音场景序列中出现次数最多的噪音场景作为与所述语音片段相匹配的目标噪音场景。

21、可选的，根据所述语音片段中语音单元的噪音特征和预设的降噪策略库中各个噪音场景对应的样本噪音特征，确定所述语音片段中语音单元匹配的噪音场景，包括：

22、计算所述语音片段中语音单元的噪音特征与预设的降噪策略库中各个噪音场景对应的样本噪音特征之间的噪音特征相似度；

23、将所有噪音特征相似度中的最大相似度对应的噪音场景作为所述语音单元匹配的噪音场景。

24、可选的，所述待降噪语音中语音单元的噪音特征的确定过程包括：

25、生成所述待降噪语音中的语音单元的语音模拟信号；

26、基于所述语音单元的语音模拟信号，计算所述语音单元的平均值特征、标准差特征、最大值特征和最小值特征；

27、将由所述平均值特征、所述标准差特征、所述最大值特征和所述最小值特征组成的序列作为所述语音单元的噪音特征。

28、可选的，所述降噪策略库的构建过程包括：

29、采集各个噪音场景下的样本噪声语音，并根据各个噪音场景下的样本噪声语音，确定各个噪音场景对应的样本噪音特征；

30、将所述噪音场景、所述噪音场景对应的样本噪音特征和所述噪音场景对应的降噪处理策略关联并存储到预设的降噪策略库中。

31、根据本技术实施例的第二方面，提供了一种语音降噪装置，包括：

32、语音划分模块，用于根据待降噪语音的语音单元的噪音特征，对所述待降噪语音进行片段划分，得到语音片段；所述语音单元包括预设数量的连续语音帧；所述语音片段包括至少一个语音单元，且同一语音片段中的相邻语音单元的噪音特征相似度达到预设阈值；

33、降噪策略确定模块，用于根据所述语音片段中的语音单元的噪音特征，从预设的降噪策略库中，确定出与所述语音片段对应的降噪处理策略，所述降噪处理策略包括至少一种语音降噪处理方法；

34、降噪处理模块，用于按照所述降噪处理策略，对所述语音片段进行降噪处理。

35、根据本技术实施例的第三方面，提供了一种电子设备，包括：存储器和处理器；

36、所述存储器与所述处理器连接，用于存储程序；

37、所述处理器，用于通过运行所述存储器中的程序，实现上述语音降噪方法。

38、根据本技术实施例的第四方面，提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现上述语音降噪方法。

39、本技术提出的语音降噪方法，根据待降噪语音的语音单元的噪音特征，对待降噪语音进行片段划分，得到语音片段；语音单元包括预设数量的连续语音帧；语音片段包括至少一个语音单元，且同一语音片段中的相邻语音单元的噪音特征相似度达到预设阈值；根据语音片段中的语音单元的噪音特征，从预设的降噪策略库中，确定出与语音片段对应的降噪处理策略，降噪处理策略包括至少一种语音降噪处理方法；按照降噪处理策略，对语音片段进行降噪处理。采用本技术的技术方案，能够从降噪策略库匹配出待降噪语音中各个语音片段对应的降噪处理策略，针对不同噪音场景下的语音片段采用相匹配的降噪处理策略进行降噪，从而提高多噪音场景中的语音降噪准确度和降噪效果。