技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音变声方法、装置、设备及存储介质与流程 > 正文

语音变声方法、装置、设备及存储介质与流程

国知局
2024-06-21 11:27:11

本申请涉及语音处理领域，尤其涉及语音变声方法、装置、设备及存储介质。

背景技术：

1、语音伪装设备，又称为变声器，被广泛应用于社会的各个领域中。例如，变声器可以应用于对举报人的声音进行变声，防止打击报复；又如，变声器还可以应用于对独居女士和小孩的声音进行变声，以应对骚扰电话和陌生人来访；又如，变声器还可以应用于需要变声的小游戏中，等等。

2、目前，大多数的变声器主要是通过改变人声声调来实现变声，变声效果不够好。

技术实现思路

1、本申请提供语音变声方法、装置、设备及存储介质，以解决通过改变人声声调来实现变声带来的变声效果不够好的技术问题。

2、第一方面，提供一种语音变声方法，包括：

3、获取待处理的原始语音信号；

4、对所述原始语音信号进行共振峰倒谱修正和共振峰线性预测系数(linearpredictive coefficients，lpc)修正，得到所述原始语音信号对应的变声语音信号。

5、在该技术方案中，在获取到待处理的原始语音信号后，通过对原始语音信号进行共振峰倒谱修正和共振峰线性预测系数修正，得到原始语音信号对应的变声语音信号；通过对原始语音信号的共振峰进行修正，可以改变原始语音信号的声音音色，从而达到变声的效果；通过从倒谱信息和线性预测系数两个方面对原始语音信号的共振峰进行修正，能够对原始语音信号的共振峰结构进行更准确地调整，从而使得变声后的声音音色更加自然和真实，提升变声效果。

6、结合第一方面，在一种可能的实现方式中，所述对所述原始语音信号进行共振峰倒谱修正和共振峰线性预测系数修正，得到所述原始语音信号对应的变声语音信号，包括：对所述原始语音信号进行倒谱信息变换，得到第一共振峰修正因子；对所述原始语音信号进行线性预测系数变换，得到第二共振峰修正因子；根据所述第一共振峰修正因子和所述第二共振峰修正因子，对所述原始语音信号的共振峰进行修正，得到所述原始语音信号对应的变声语音信号。

7、结合第一方面，在一种可能的实现方式中，所述对所述原始语音信号进行倒谱信息变换，得到第一共振峰修正因子，包括：计算所述原始语音信号的对数谱，得到第一对数谱信号；对所述第一对数谱信号进行伸缩处理，得到第二对数谱信号；计算所述第二对数谱信号与所述第一对数谱信号之间的信号差值，得到差值对数谱信号；对所述差值对数谱信号进行傅里叶逆变换，得到差分倒谱信号；根据所述差分倒谱信号，确定第一共振峰修正因子。通过对原始语音信号的对数谱进行伸缩处理，并将伸缩处理得到的对数谱信号与原始的对数谱信号求信号差值来得到第一共振峰修正因子，可以从倒谱信号方面修正原始语音信号的共振峰结构。

8、结合第一方面，在一种可能的实现方式中，所述对所述第一对数谱信号进行伸缩处理，得到第二对数谱信号，包括：对所述第一对数谱信号进行插值运算，得到所述第二对数谱信号。

9、结合第一方面，在一种可能的实现方式中，所述对所述原始语音信号进行线性预测系数变换，得到第二共振峰修正因子，包括：计算所述原始语音信号的线性预测归一化包络系数；对所述线性预测归一化包络系数进行伸缩处理，得到所述第二共振峰修正因子。通过对原始语音信号的线性预测归一化包络系数进行伸缩处理来得到第二共振峰修正因子，可以从lpc方面修正原始语音信号的共振峰结构。

10、结合第一方面，在一种可能的实现方式中，所述对所述线性预测归一化包络系数进行伸缩处理，得到所述第二共振峰修正因子，包括：对所述线性预测归一化包络系数进行插值运算，得到所述第二共振峰修正因子。

11、结合第一方面，在一种可能的实现方式中，所述根据所述第一共振峰修正因子和所述第二共振峰修正因子，对所述原始语音信号的共振峰进行修正，得到所述原始语音信号对应的变声语音信号，包括：对所述第一共振峰修正因子和所述第二共振峰修正因子进行融合，得到共振峰拟合因子；利用所述共振峰拟合因子对所述原始语音信号的共振峰进行修正，得到所述变声语音信号。

12、结合第一方面，在一种可能的实现方式中，所述利用所述共振峰拟合因子对所述原始语音信号的共振峰进行修正，得到所述变声语音信号，包括：将所述共振峰拟合因子与所述原始语音信号对应的频域信号相乘，得到所述变声语音信号。

13、第二方面，提供一种语音变声装置，包括：

14、语音信号获取模块，用于获取待处理的原始语音信号；

15、修正模块，用于对所述原始语音信号进行共振峰倒谱修正和共振峰线性预测系数修正，得到所述原始语音信号对应的变声语音信号。

16、第三方面，提供一种计算机设备，包括存储器以及一个或多个处理器，所述存储器连接至所述一个或多个处理器，一个或多个处理器用于执行存储在存储器中的一个或多个计算机程序，一个或多个处理器在执行一个或多个计算机程序时，使得该计算机设备实现上述第一方面的语音变声方法。

17、第四方面，提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序包括程序指令，上述程序指令当被处理器执行时使上述处理器执行上述第一方面的语音变声方法。

18、本申请可以实现如下技术效果：通过对原始语音信号的共振峰进行修正，可以改变原始语音信号的声音音色，从而达到变声的效果；通过从倒谱信息和线性预测系数两个方面对原始语音信号的共振峰进行修正，能够对原始语音信号的共振峰结构进行更准确地调整，从而使得变声后的声音音色更加自然和真实，提升变声效果。

技术特征：

1.一种语音变声方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述原始语音信号进行共振峰倒谱修正和共振峰线性预测系数修正，得到所述原始语音信号对应的变声语音信号，包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述原始语音信号进行倒谱信息变换，得到第一共振峰修正因子，包括：

4.根据权利要求3所述的方法，其特征在于，所述对所述第一对数谱信号进行伸缩处理，得到第二对数谱信号，包括：

5.根据权利要求2所述的方法，其特征在于，所述对所述原始语音信号进行线性预测系数变换，得到第二共振峰修正因子，包括：

6.根据权利要求5所述的方法，其特征在于，所述对所述线性预测归一化包络系数进行伸缩处理，得到所述第二共振峰修正因子，包括：

7.根据权利要求2-6任一项所述的方法，其特征在于，所述根据所述第一共振峰修正因子和所述第二共振峰修正因子，对所述原始语音信号的共振峰进行修正，得到所述原始语音信号对应的变声语音信号，包括：

8.根据权利要求7所述的方法，其特征在于，所述利用所述共振峰拟合因子对所述原始语音信号的共振峰进行修正，得到所述变声语音信号，包括：

9.一种语音变声装置，其特征在于，包括：

10.一种计算机设备，其特征在于，包括存储器、处理器，所述存储器连接至所述处理器，所述处理器用于执行存储在所述存储器中的一个或多个计算机程序，所述处理器在执行所述一个或多个计算机程序时，使得所述计算机设备实现如权利要求1-8任一项所述的方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-8任一项所述的方法。

技术总结本申请提供语音变声方法、装置、设备及存储介质，方法包括：获取待处理的原始语音信号；对所述原始语音信号进行共振峰倒谱修正和共振峰线性预测系数修正，得到所述原始语音信号对应的变声语音信号。该技术方案通过从倒谱信息和线性预测系数两个方面对原始语音信号的共振峰进行修正，能够对原始语音信号的共振峰结构进行更准确地调整，从而使得变声后的声音音色更加自然和真实，提升变声效果。技术研发人员：宋明辉,王红丽受保护的技术使用者：深圳市中科蓝讯科技股份有限公司技术研发日：技术公布日：2024/2/8