技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种信号处理方法、装置、设备和介质与流程 > 正文

一种信号处理方法、装置、设备和介质与流程

国知局
2024-06-21 10:39:23

本发明涉及信号处理，尤其涉及一种信号处理方法、装置、设备和介质。

背景技术：

1、在单通道语音降噪任务中，对于一些突发的非稳态噪声信号，传统的信号处理技术已经遇到极大瓶颈，难以突破。最近将深度神经网络技术用在了语音降噪场景，取得了较好的效果。其中，一般神经网络降噪的训练方式是使用纯净语音混合噪声信号的方式生成带噪语音，然后让带噪语音经过神经网络，并采用纯净语音作为目标信号进行训练，从而让模型具有降噪的功能。

2、现有技术中，采用fullsubnet网络进行语音降噪的过程中，子频带(sub-band)网络对每个频点使用相同的模型进行独立预测，并未充分利用fft后的每个频点和其相邻频点之间的相关性，从而导致降噪效果得到了限制。

技术实现思路

1、本发明提供了一种信号处理方法、装置、设备和介质，更好地利用了每个频点之间的相关性，从而提升了对语音信号的降噪效果。

2、根据本发明的一方面，提供了一种信号处理方法，包括：

3、获取一帧原始语音信号或每个频点组中每个频点的原始频谱信息和全频带降噪后频谱幅度值；其中，每帧原始语音信号至少包括两个频点组；

4、根据所述原始频谱信息、所述全频带降噪后频谱幅度值和上一频点的掩码特征确定当前频点的原始掩码；

5、根据每个频点的原始掩码和原始频谱信息确定所述原始语音信号对应的降噪语音信号。

6、根据本发明的另一方面，提供了一种信号处理装置，包括：

7、获取模块，用于确定一帧原始语音信号或每个频点组中每个频点的原始频谱信息和全频带降噪后频谱幅度值；其中，每帧原始语音信号至少包括两个频点组；

8、第一确定模块，用于根据所述原始频谱信息、所述全频带降噪后频谱幅度值和上一频点的掩码特征确定当前频点的原始掩码；

9、第二确定模块，用于根据每个频点的原始掩码和原始频谱信息确定所述原始语音信号对应的降噪语音信号。

10、根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：

11、至少一个处理器；以及

12、与所述至少一个处理器通信连接的存储器；其中，

13、所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的信号处理方法。

14、根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明任一实施例所述的信号处理方法。

15、本发明实施例的技术方案，通过获取一帧原始语音信号或每个频点组中每个频点的原始频谱信息和全频带降噪后频谱幅度值，然后根据原始频谱信息、全频带降噪后频谱幅度值和上一频点的掩码特征确定当前频点的原始掩码，根据每个频点的原始掩码和原始频谱信息确定原始语音信号对应的降噪语音信号，解决了现有技术中未考虑每个频点之间相关性的问题，更好地利用了每个频点之间的相关性，从而提升了对语音信号的降噪效果。

16、应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种信号处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述获取一帧原始语音信号或每个频点组中每个频点的原始频谱信息和全频带降噪后频谱幅度值之前，还包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述原始频谱信息、所述全频带降噪后频谱幅度值和上一频点的掩码特征确定当前频点的原始掩码，包括：

4.根据权利要求3所述的方法，其特征在于，在所述将所述拼接信息和上一频点的掩码特征进行组合，得到对应的组合信息之前，还包括：

5.根据权利要求1所述的方法，其特征在于，所述根据每个频点的原始掩码和原始频谱信息确定所述原始语音信号对应的降噪语音信号，包括：

6.根据权利要求1所述的方法，其特征在于，所述方法，还包括：

7.根据权利要求6所述的方法，其特征在于，所述确定每个频点组中所包含的频点总数量，包括：

8.根据权利要求6所述的方法，其特征在于，每个所述频点组中首个频点所对应上一频点的掩码特征均为初始掩码。

9.一种信号处理装置，其特征在于，包括：

10.一种电子设备，其特征在于，所述电子设备包括：

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-8中任一项所述的信号处理方法。

技术总结本发明公开了一种信号处理方法、装置、设备和介质。该方法包括：获取一帧原始语音信号或每个频点组中每个频点的原始频谱信息和全频带降噪后频谱幅度值；其中，每帧原始语音信号至少包括两个频点组；根据原始频谱信息、全频带降噪后频谱幅度值和上一频点的掩码特征确定当前频点的原始掩码；根据每个频点的原始掩码和原始频谱信息确定原始语音信号对应的降噪语音信号。本实施例解决了现有技术中未考虑每个频点之间相关性的问题，更好地利用了每个频点之间的相关性，从而提升了对语音信号的降噪效果。技术研发人员：雷延强受保护的技术使用者：广州视源电子科技股份有限公司技术研发日：技术公布日：2024/1/15