技术新讯 > 乐器声学设备的制造及制作,分析技术 > 基于神经网络检测的语音增强方法及其相关装置与流程 > 正文

基于神经网络检测的语音增强方法及其相关装置与流程

国知局
2024-06-21 11:54:00

本申请属于音频处理，尤其涉及一种基于神经网络检测的语音增强方法及其相关装置。

背景技术：

1、用户在使用麦克风时，麦克风除了会采集到用户的声音，也会采集到环境噪音，而环境噪音会对麦克风采集到的用户声音造成干扰，影响用户体验。终端设备(例如智能手机)上的麦克风可以利用终端设备的强大算力，来进行降噪处理。而移动麦克风设备(例如无线领夹式麦克风)的算力通常较弱，其通常依靠阈值来对采集到的语音进行降噪处理。在相关技术中，当处于户外环境时，由于环境噪声会随环境发生变化，因此预先设置的阈值可能会与环境不适应，导致麦克风设备的降噪性能降低，影响用户体验。

技术实现思路

1、本申请实施例提供一种基于神经网络检测的语音增强方法及其相关装置，可以解决相关技术中在噪声动态变化场景下麦克风的降噪性能较差的问题。

2、第一方面，本申请实施例提供了一种基于神经网络检测的语音增强方法，应用于麦克风，所述方法包括：

3、获取待处理音频帧；

4、将所述待处理音频帧输入训练好的判断神经网络，得到所述待处理音频帧的判断结果；

5、当所述判断结果为带噪语音帧后，利用语音增强算法对所述带噪语音帧进行语音增强处理，得到语音增强音频帧。

6、第二方面，本申请实施例提供了一种基于神经网络检测的语音增强装置，应用于麦克风，所述装置包括：

7、获取模块，用于获取待处理音频帧；

8、输入模块，用于将所述待处理音频帧输入训练好的判断神经网络，得到所述待处理音频帧的判断结果；

9、处理模块，用于当所述判断结果为带噪语音帧后，利用语音增强算法对所述带噪语音帧进行语音增强处理，得到语音增强音频帧。

10、第三方面，本申请实施例提供了一种麦克风，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于神经网络检测的语音增强方法的步骤。

11、第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于神经网络检测的语音增强方法的步骤。

12、第五方面，本申请实施例提供了一种计算机程序产品，当计算机程序产品在麦克风上运行时，使得麦克风执行上述基于神经网络检测的语音增强方法。

13、本申请实施例与现有技术相比的有益效果是：本申请实施例通过获取待处理音频帧，并将待处理音频帧输入训练好的判断神经网络，得到待处理音频帧的判断结果，当判断结果为带噪语音帧后，利用语音增强算法对带噪语音帧进行语音增强处理，得到语音增强音频帧。本申请实施例利用判断神经网络来判断待处理音频帧是否为带噪语音帧，不会受到现有技术阈值的限制，即使在动态噪音环境下也能准确判断待处理音频帧是否为带噪语音帧。并利用语音增强算法来对带噪语音帧进行语音增强，从而实现对带噪语音帧的降噪处理，提高了麦克风的降噪性能，提升了用户体验。

技术特征：

1.一种基于神经网络检测的语音增强方法，其特征在于，所述方法应用于麦克风，所述方法包括：

2.如权利要求1所述的基于神经网络检测的语音增强方法，其特征在于，所述判断神经网络为vad神经网络，所述vad神经网络包括：两层门控循环单元和一层全连接层，第一层所述门控循环单元经过relu激活函数，第二层所述门控循环单元经过relu激活函数，所述全连接层经过softmax激活函数。

3.如权利要求2所述的基于神经网络检测的语音增强方法，其特征在于，所述将所述待处理音频帧输入训练好的判断神经网络，包括：

4.如权利要求1所述的基于神经网络检测的语音增强方法，其特征在于，在所述将所述待处理音频帧输入训练好的判断神经网络，得到所述待处理音频帧的判断结果之前，所述方法还包括：

5.如权利要求1所述的基于神经网络检测的语音增强方法，其特征在于，所述语音增强算法为omlsa算法，所述利用语音增强算法对所述带噪语音帧进行语音增强处理，得到语音增强音频帧，包括：

6.如权利要求5所述的基于神经网络检测的语音增强方法，其特征在于，所述利用omlsa算法对所述带噪语音帧进行语音增强处理，得到语音增强音频帧，包括：

7.如权利要求6所述的基于神经网络检测的语音增强方法，其特征在于，所述基于所述增益对所述带噪语音帧进行语音增强处理，得到所述语音增强音频帧，包括：

8.一种基于神经网络检测的语音增强装置，其特征在于，所述装置应用于麦克风，所述装置包括：

9.一种麦克风，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于神经网络检测的语音增强方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于神经网络检测的语音增强方法的步骤。

技术总结本申请适用于音频处理技术领域，提供了一种基于神经网络检测的语音增强方法及其相关装置。上述基于神经网络检测的语音增强方法包括：获取待处理音频帧；将待处理音频帧输入训练好的判断神经网络，得到待处理音频帧的判断结果；当判断结果为带噪语音帧后，利用语音增强算法对带噪语音帧进行语音增强处理，得到语音增强音频帧。本申请实施例利用判断神经网络来判断待处理音频帧是否为带噪语音帧，不会受到现有技术阈值的限制，即使在动态噪音环境下也能准确判断待处理音频帧是否为带噪语音帧。并利用语音增强算法来对带噪语音帧进行语音增强，从而实现对带噪语音帧的降噪处理，提高了麦克风的降噪性能，提升了用户体验。技术研发人员：邓刚,赵宏亮,欧阳梓俊受保护的技术使用者：深圳市长丰影像器材有限公司技术研发日：技术公布日：2024/5/29