技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音增强方法、装置、电子设备及计算机可读存储介质与流程 > 正文

语音增强方法、装置、电子设备及计算机可读存储介质与流程

国知局
2024-06-21 11:43:13

本技术涉及语音，具体涉及一种语音增强方法、装置、电子设备及计算机可读存储介质。

背景技术：

1、语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术。语音增强十分依赖语音采集设备，好的语音采集设备往往能够较大的降低语音增强的难度，从而提高语音增强的效果。在语音采集设备固定不变的情况下，如何提高语音增强的效果已成为一个亟待解决的技术问题。

技术实现思路

1、本技术实施例公开一种语音增强方法、装置、电子设备及计算机可读存储介质，用于提高语音增强的效果。

2、第一方面，本技术实施例公开了一种语音增强方法，所述方法应用于语音增强系统中的电子设备，所述语音增强系统还包括m个语音采集设备，所述m个语音采集设备设置在不同位置，m为大于1的整数，所述方法包括：

3、获取n个语音采集设备采集的语音信息，所述n个语音采集设备为所述m个语音采集设备中处于唤醒状态的语音采集设备，n为大于0且小于或等于m的整数；

4、根据所述语音信息和所述n个语音采集设备确定k个用户、k个声纹和k个语音采集设备组，所述k个用户与所述k个声纹一一对应，所述k个用户与所述k个语音采集设备组一一对应，k为大于1的整数；

5、在所述k个语音采集设备组中存在语音采集设备的数量大于1的语音采集设备组的情况下，根据l个声纹和l个语音采集设备组，确定l个用户的目标语音采集设备阵列，所述l个语音采集设备组为所述k个语音采集设备组中语音采集设备的数量大于1的语音采集设备组，所述l个用户为所述l个语音采集设备组对应的用户，所述l个声纹为所述l个语音采集设备组对应的声纹，l为大于0且小于或等于k的整数；

6、根据所述l个声纹和所述目标语音采集设备阵列中每个语音采集设备的位置，对所述目标语音采集设备阵列采集的语音信息进行多通道语音增强，得到所述l个用户的目标语音信息。

7、第二方面，本技术实施例公开了一种语音增强装置，所述装置应用于语音增强系统中的电子设备，所述语音增强系统还包括m个语音采集设备，所述m个语音采集设备设置在不同位置，m为大于1的整数，包括：

8、获取单元，用于获取n个语音采集设备采集的语音信息，所述n个语音采集设备为所述m个语音采集设备中处于唤醒状态的语音采集设备，n为大于0且小于或等于m的整数；

9、第一确定单元，用于根据所述语音信息和所述n个语音采集设备确定k个用户、k个声纹和k个语音采集设备组，所述k个用户与所述k个声纹一一对应，所述k个用户与所述k个语音采集设备组一一对应，k为大于1的整数；

10、第二确定单元，用于在所述k个语音采集设备组中存在语音采集设备的数量大于1的语音采集设备组的情况下，根据l个声纹和l个语音采集设备组，确定l个用户的目标语音采集设备阵列，所述l个语音采集设备组为所述k个语音采集设备组中语音采集设备的数量大于1的语音采集设备组，所述l个用户为所述l个语音采集设备组对应的用户，所述l个声纹为所述l个语音采集设备组对应的声纹，l为大于0且小于或等于k的整数；

11、语音增强单元，用于根据所述l个声纹和所述目标语音采集设备阵列中每个语音采集设备的位置，对所述目标语音采集设备阵列采集的语音信息进行多通道语音增强，得到所述l个用户的目标语音信息。

12、作为一种可能的实施方式，所述第一确定单元具体用于：

13、确定所述语音信息包括的语音信号对应的用户，得到k个用户；

14、确定所述n个语音采集设备中分别被所述k个用户唤醒的语音采集设备，得到k个语音采集设备组；

15、从所述语音信息中分别提取所述k个用户的声纹，得到k个声纹。

16、作为一种可能的实施方式，所述第二确定单元具体用于：

17、确定第一语音采集设备组中的第一语音采集设备和第二语音采集设备，所述第一语音采集设备组为所述l个语音采集设备组中任一语音采集设备组；

18、根据第一声纹、所述第一语音采集设备的位置和所述第二语音采集设备的位置，确定第一用户的位置，所述第一声纹为所述第一语音采集设备组对应的声纹，所述第一用户为所述第一语音采集设备组对应的用户；

19、根据所述第一语音采集设备的位置、所述第二语音采集设备的位置和所述第一用户的位置，确定所述第一用户的语音采集设备阵列，得到l个用户的目标语音采集设备阵列，所述第一用户的目标语音采集设备阵列包括所述第一语音采集设备和所述第二语音采集设备。

20、作为一种可能的实施方式，所述第二确定单元确定第一语音采集设备组中的第一语音采集设备和第二语音采集设备包括：

21、在所述第一语音采集设备组中存在被所述第一用户独立唤醒的语音采集设备的情况下，将被所述第一用户独立唤醒的语音采集设备中唤醒时间最早的语音采集设备确定为第一语音采集设备；

22、在所述第一语音采集设备组中不存在被所述第一用户独立唤醒的语音采集设备的情况下，将所述第一语音采集设备组中唤醒时间最早的语音采集设备确定为第一语音采集设备；

23、将所述第一语音采集设备组中与所述第一语音采集设备之间的距离最小的语音采集设备确定为第二语音采集设备。

24、作为一种可能的实施方式，所述第二确定单元根据第一声纹、所述第一语音采集设备的位置和所述第二语音采集设备的位置，确定第一用户的位置包括：

25、获取所述第一语音采集设备采集的第一语音信息；

26、获取所述第二语音采集设备采集的第二语音信息；

27、根据所述第一声纹从所述第一语音信息中提取所述第一用户的语音信号，得到第一语音信号；

28、根据所述第一声纹从所述第二语音信息中提取所述第一用户的语音信号，得到第二语音信号；

29、根据所述第一语音信号、所述第二语音信号、所述第一语音采集设备的位置和所述第二语音采集设备的位置，确定所述第一用户的位置。

30、作为一种可能的实施方式，所述第二确定单元根据所述第一语音采集设备的位置、所述第二语音采集设备的位置和所述第一用户的位置，确定所述第一用户的语音采集设备阵列，得到l个用户的目标语音采集设备阵列包括：

31、根据所述第一语音采集设备的位置、所述第二语音采集设备的位置和所述第一用户的位置，确定所述第一用户的初始语音采集设备阵列，得到l个用户的初始语音采集设备阵列；

32、在所述l个用户的初始语音采集设备阵列之间存在重叠的情况下，对所述l个用户的初始语音采集设备阵列进行去重处理和/或均衡处理，得到所述l个用户的目标语音采集设备阵列；

33、在所述l个用户的初始语音采集设备阵列之间不存在重叠的情况下，将所述l个用户的初始语音采集设备阵列确定为所述l个用户的目标语音采集设备阵列。

34、作为一种可能的实施方式，所述语音增强单元，还用于在所述k个语音采集设备组中存在语音采集设备的数量等于1的语音采集设备组，且第三语音采集设备包括一个麦克风的情况下，对所述第三语音采集设备采集的语音信息进行单通道语音增强，得到第二用户的目标语音信息，所述第三语音采集设备为所述k个语音采集设备组中语音采集设备的数量等于1的任一语音采集设备组中的语音采集设备，所述第二用户为所述第三语音采集设备对应的用户。

35、作为一种可能的实施方式，所述语音增强单元，还用于在所述k个语音采集设备组中存在语音采集设备的数量等于1的语音采集设备组，且所述第三语音采集设备包括多个麦克风的情况下，对所述多个麦克风采集的语音信息进行多通道语音增强，得到所述第二用户的目标语音信息。

36、第三方面，本技术实施例公开了一种电子设备，包括处理器和存储器，所述处理器调用所述存储器中存储的计算机程序执行第一方面公开的方法。

37、第四方面，本技术实施例公开了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序或计算机指令，当该计算机程序或计算机指令被处理器运行时，实现如上述第一方面公开的方法。

38、第五方面，本技术实施例公开了一种计算机程序产品，该计算机程序产品包括计算机程序代码，当该计算机程序代码被处理器运行时，使得上述方法被执行。

39、本技术实施例中，语音增强系统中的电子设备获取m个语音采集设备中处于唤醒状态的n个语音采集设备采集的语音信息，根据语音信息和n个语音采集设备确定k个用户、k个声纹和k个语音采集设备组，在k个语音采集设备组中存在语音采集设备的数量大于1的语音采集设备组的情况下，根据l个声纹和l个语音采集设备组确定l个用户的目标语音采集设备阵列，根据l个声纹和目标语音采集设备阵列中每个语音采集设备的位置，对目标语音采集设备阵列采集的语音信息进行多通道语音增强，得到l个用户的目标语音信息。可见，在用户唤醒的语音采集设备为多个的情况下，可以先确定用于采集用户语音信息的语音采集设备阵列，之后对语音采集设备阵列采集的语音信息进行多通道语音增强，可以通过多个语音采集设备采集用户的语音信息，进而对多个语音设备采集的语音信息进行多通道语音增强，可以提高语音增强的效果。