技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音信号处理方法、装置、电子设备及可读存储介质与流程 > 正文

语音信号处理方法、装置、电子设备及可读存储介质与流程

国知局
2024-06-21 11:57:28

本技术涉及信号处理，尤其涉及一种语音信号处理方法、装置、电子设备及可读存储介质。

背景技术：

1、随着通信行业的不断发展，利用移动终端(例如手机)来进行语音通话成为人们越来越重要的沟通、交流方式，由于人们常常会处于比较嘈杂的环境中，例如用户在公交车上、在马路旁或在商场中，若用户在这种嘈杂的环境下使用移动终端进行语音通话，则常常会受到噪音的干扰，例如，当用户a位于马路旁时，通过移动终端与用户b进行语音通话，用户b接收到的语音信号中，不仅包含正常通话的信号，同时还会包含汽车驶过时产生的噪音信号，这种噪音信号可以称为背景噪音。为了提高用户使用移动终端进行语音通话的通话质量，需要在移动终端进行语音通话的过程中对语音信号进行降噪处理。

2、通常，移动终端中预先存储一些常见的背景噪音，当该移动终端采集到用户的语音信号后，在将采集到的语音信号发送给通话对端之前，先在预存的各背景噪音中，选取出与采集到的语音信号相似的背景噪音，然后根据选取出的背景噪音，对采集到的语音信号进行降噪处理，即在采集到的语音信号中消去选取出的背景噪音。

3、可见，移动终端在对采集到的语音信号进行降噪处理时，是在预先存储的各背景噪音中，选取出与采集到的语音信号相似的背景噪音，然后根据选取出的背景噪音，对采集到的语音信号进行降噪处理，这就可能出现移动终端中预先存储的各背景噪音中并不包含与采集到的语音信号相似的背景噪音，从而移动终端无法选取出合适的背景噪音来对采集到的语音信号进行降噪处理的情况，此种方式对语音信号进行降噪处理时，不能产生很好的降噪处理效果，影响了用户的语音通话质量。

技术实现思路

1、本技术的主要目的在于提供一种语音信号处理方法、装置、电子设备及可读存储介质，旨在解决如何提高语音信号的降噪处理效果的技术问题。

2、为实现上述目的，本技术提供一种语音信号处理方法，所述语音信号处理方法包括：

3、获取目标语音基矩阵与待处理的语音信号；

4、基于所述目标语音基矩阵分解所述语音信号，得到语音编码矩阵；

5、基于所述语音编码矩阵重构所述语音信号，得到所述语音信号对应的纯净语音分量，基于所述纯净语音分量得到语音信号处理结果。

6、可选地，所述获取目标语音基矩阵与待处理的语音信号的步骤之前，所述方法还包括：

7、获取训练语音信号与训练矩阵，其中，所述训练矩阵至少包括语音基矩阵与编码矩阵；

8、确定所述训练矩阵包括的各矩阵的乘积，将各所述矩阵的乘积作为目标矩阵；

9、将所述训练语音信号对应的语音幅度频谱矩阵作为第一语音幅度频谱矩阵，将所述第一语音幅度频谱矩阵与目标矩阵之间的相对熵作为第一相对熵；

10、若所述第一相对熵大于预设阈值，则调整所述训练矩阵中的语音基矩阵与编码矩阵，返回执行确定所述训练矩阵包括的各矩阵的乘积的步骤，直至所述第一相对熵小于或等于所述预设阈值；

11、将所述第一相对熵小于或等于所述预设阈值时，所述训练矩阵中的语音基矩阵作为目标语音基矩阵。

12、可选地，所述将所述训练语音信号对应的语音幅度频谱矩阵作为第一语音幅度频谱矩阵的步骤，包括：

13、对所述训练语音信号进行傅里叶变换，得到频谱语音信号；

14、对于所述频谱语音信号的每一帧频谱信号，确定所述频谱信号的每一频点对应的幅值，聚合每一所述频点对应的幅值得到所述频谱信号对应的语音幅度频谱矢量；

15、聚合每一帧所述频谱信号对应的语音幅度频谱矢量，得到第一语音幅度频谱矩阵。

16、可选地，所述基于所述目标语音基矩阵分解所述语音信号，得到语音编码矩阵的步骤，包括：

17、对于所述语音信号的每一帧信号，获取所述信号对应的纯净语音幅度频谱矢量；

18、初始化编码矢量，以所述目标语音基矩阵乘以所述编码矢量，得到目标矢量，将所述纯净语音幅度频谱矢量与所述纯净语音幅度频谱矢量之间的相对熵作为第二相对熵；

19、若所述第二相对熵大于预设阈值，则调整所述编码矢量，返回执行以所述目标语音基矩阵乘以所述编码矢量的步骤，直至所述第二相对熵小于或等于所述预设阈值；

20、将所述第一相对熵小于或等于所述预设阈值时，所述编码矢量作为所述信号对应的最优编码矢量；

21、分解所述信号对应的最优编码矢量，得到所述信号的语音编码矢量；

22、聚合每一帧所述信号对应的语音编码矢量得到语音编码矩阵。

23、可选地，所述获取所述信号对应的纯净语音幅度频谱矢量的步骤之前，所述方法还包括：

24、基于预设的噪声分离算法分离所述语音信号，得到粗纯净语音信号与粗噪声语音信号；

25、将所述粗纯净语音信号对应的语音幅度频谱矩阵作为纯净语音幅度频谱矩阵，将所述粗噪声语音信号对应的语音幅度频谱矩阵作为噪声语音幅度频谱矩阵，其中，所述纯净语音幅度频谱矩阵中的每一单位矢量分别为每一帧所述语音信号对应的纯净语音幅度频谱矢量，所述噪声语音幅度频谱矩阵中的每一单位矢量分别为每一帧所述语音信号对应的噪声语音幅度频谱矢量。

26、可选地，基于所述语音编码矩阵重构所述语音信号，得到所述语音信号对应的纯净语音分量的步骤，包括：

27、对于所述语音信号的每一帧信号，获取所述信号对应的噪声语音幅度频谱矢量；

28、基于所述语音编码矩阵获取所述信号对应的语音编码矢量；

29、将所述信号对应的所述语音编码矢量与所述信号对应的所述噪声语音幅度频谱矢量，输入至预设的纯净语音分量算法中，输出得到所述信号对应的纯净语音分量。

30、可选地，所述基于所述纯净语音分量得到语音信号处理结果的步骤，包括：

31、对所述纯净语音分量进行逆傅里叶变换，得到纯净语音信号，将所述纯净语音信号作为语音信号处理结果；或者，

32、以预设增益因子调整所述纯净语音分量，得到语音增强后的纯净语音分量，对语音增强后的所述纯净语音分量进行逆傅里叶变换，得到语音增强后的纯净语音信号，将所述语音增强后的纯净语音信号作为语音信号处理结果。

33、本技术还提供一种语音信号处理装置，所述语音信号处理装置包括：

34、获取模块，用于获取目标语音基矩阵与待处理的语音信号；

35、分解模块，用于基于所述目标语音基矩阵分解所述语音信号，得到语音编码矩阵；

36、重构模块，用于基于所述语音编码矩阵重构所述语音信号，得到所述语音信号对应的纯净语音分量，基于所述纯净语音分量得到语音信号处理结果。

37、本技术还提供一种电子设备，所述电子设备为实体设备，所述电子设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述语音信号处理方法的步骤。

38、本技术还提供一种可读存储介质，所述可读存储介质为计算机可读存储介质，所述计算机可读存储介质上存储有实现语音信号处理方法的程序，所述实现语音信号处理方法的程序被处理器执行以实现如上所述语音信号处理方法的步骤

39、本技术还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述的语音信号处理方法的步骤。

40、本技术中获取目标语音基矩阵与待处理的语音信号；基于所述目标语音基矩阵分解所述语音信号，得到语音编码矩阵；基于所述语音编码矩阵重构所述语音信号，得到所述语音信号对应的纯净语音分量，基于所述纯净语音分量得到语音信号处理结果。如此，与预先存储一些常见的背景噪音，选取出与采集到的语音信号相似的背景噪音，然后根据选取出的背景噪音，对采集到的语音信号进行降噪处理方式相比，本技术实施例，基于语音矩阵分解语音信号，得到语音编码矩阵，再基于该语音编码矩阵重构语音信号，以分离语音信号中的纯净语音分量，从而实现了语音信号的降噪处理，基于语音编码矩阵分离语音信号中的纯净语音分量，提高了语音信号的降噪处理效果。