技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种变声程序的形成方法、存储介质和使用终端 > 正文

一种变声程序的形成方法、存储介质和使用终端

国知局
2024-06-21 11:39:26

本发明属于声音处理，特别是涉及一种变声程序的形成方法、存储介质和使用终端。

背景技术：

1、变声器是通过改变输入音频的音色、音调，并将变声后的音频输出的工具。根据变声器材质不同，变声器分为变声器硬件和变声器软件。变声器硬件，即通过硬件实现变声的工具，变声器软件，即通过软件实现变声的工具。

2、目前市场上的变声器，无论是硬件或者软件，在使用过程中，均是将整个场景中的声音数据进行转换，这样在采集数据变音的过程中，如果将多人讲话内容均收录进行变音处理，会出现以下多种情况：

3、一、对于变声输出结果为固定音色的变音器来讲，在收录多人讲话内容时，将会输出相同音色的结果，将会被直接察觉出使用变声器；

4、二、对于变声输出结果是通过固定调整声音均衡器内相关参数来改变输出结果的变声器来讲，如果是在例如直播这种可以看到人的情形，如果在收录多人讲话内容时，同时输入的他人的声音音色被人所熟知，那么多人输入的声音依然会被察觉出在使用变声器；

5、三、使用者在使用变声器时，变声器输出的声音对于使用者来讲是符合其需求的适合的声音，但是对于同时输入的他人的声音的输出结果却不乐观，最终使得接收者听到声音后不适；

6、针对现有变声器的不足情况，我单位研究人员提出了一种只对使用者输入声音进行改变的一种程序形成方法，以保证使用者的隐秘性。

技术实现思路

1、本发明的目的在于提供一种变声程序的形成方法、存储介质和使用终端，以解决上述背景技术中提出的问题。

2、为实现上述目的，本发明采用的一个技术方案是：一种变声程序的形成方法，包括以下步骤：

3、s1：采集使用者的声音数据；

4、s2：提取声音数据中的语言特征；

5、s3：对s2中提取到的语言特征进行深度学习，构建使用者语言输入模型，通过语言输入模型形成使用者输入语言数据库；

6、s4：输入声音数据，语言输入模型提取与使用者输入语言数据库中特征相同的声音数据经变声程序输出程序中选定的变声语音结果，同时，对于与使用者输入语言数据库中特征不相同的声音数据中非使用者的声音数据原声输出。

7、优选的，所述语言输入模型为高斯混合隐马尔科夫模型或神经网络-隐马尔科夫模型。

8、优选的，采集的所述使用者的声音数据为含有使用者使用语言全部音素的自制语言段落，以方便对声纹特征的提取。

9、一种可读写存储介质，存储有程序，所述程序被处理器执行时实现上述变声程序的形成方法的结果。

10、优选的，所述可读写存储介质可读写使用者所需求的现有变声语音库数据。

11、一种变声程序使用终端，使用上述内容中的可读写存储介质，包括收音部和扬声部，所述收音部内设置有收音模块，所述扬声部内设置有扬声模块，所述收音模块和扬声模块之间电性连接，所述收音部和/或扬声部内设置有用于供电的电源模块，所述可读写存储介质置于收音部或扬声部内且与电源模块电性连接。

12、优选的，所述收音部和扬声部的体积均小于2cm3。

13、优选的，所述收音部内设置有无线信号传输模块，所述扬声部内设置有无线信号接收模块，所述收音部和扬声部内均设置有用于供电的电池。

14、优选的，所述可读写存储介质可同时读写存入至少两种变声语音库数据，所述收音部或扬声部上设置有用于转换变声语音数据库的转换开关。

15、优选的，所述无线信号传输模块可被外置智能电子设备识别。

16、本发明的有益效果：在本方案变声程序的形成方法中，通过采集使用者的声音数据，在深度学习神经网络的协同下，可以有效的做到对使用者声音特征的识别，从而在需要变声的情况下，可以有效的对使用者输入的声音和其他输入声音进行分离，从而将使用者输入的声音数据进行变声处理，将输入的其他声音数据不做处理，原声输出，有效的确保了变声器的输出效果，让他人不容易轻易察觉到使用者在使用变声器；

17、其中，通过设计所采集的使用者的声音数据为含有使用者使用语言全部音素的自制语言段落，这样可以通过重复将语言段落反复几次进行输入，在深度学习神经网络的运算下，即可快速的提取到使用者的声纹特征，完成对使用者声音数据采集的过程；

18、其中，通过将使用终端设置为收音部和扬声部，这样能使得声音收音模块和扬声模块分离，在整体上将整个使用终端一分为二，进而达到实现整个使用终端的轻便化的可能，在收音部和扬声部的体积均能压缩在2cm3的情况下，就能够实现将收音部或扬声部融入到手链、项链等随身携带的轻简物品中，让使用者在需要进行变声操作的时候可以快速实现对使用终端的使用；

19、其中，通过在收音部内设置有无线信号传输模块，在扬声部内设置有无线信号接收模块，可以将收音部和扬声部分装到不同的饰品或衣帽的不同部位上，使得对于使用终端的携带更为自然；

20、其中，通过设置无线信号传输模块可被外置智能电子设备识别，可以实现手机、智能手表等电子产品与使用终端的互通，通过程序设置可以实现变声语音库数据的切换及代替扬声部扬声等功能。

技术特征：

1.一种变声程序的形成方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种变声程序的形成方法，其特征在于：所述语言输入模型为高斯混合隐马尔科夫模型或神经网络-隐马尔科夫模型。

3.根据权利要求1所述的一种变声程序的形成方法、存储介质和使用终端，其特征在于：采集的所述使用者的声音数据为含有使用者使用语言全部音素的自制语言段落，以方便对声纹特征的提取。

4.一种可读写存储介质，其特征在于：所述可读写存储介质上存储有程序，所述程序被处理器执行时实现包括权利要求1至3中任一项所述的方法的结果。

5.根据权利要求4所述的一种可读写存储介质，其特征在于：所述可读写存储介质可读写使用者所需求的现有变声语音库数据。

6.一种变声程序使用终端，使用权利要求5中的存储介质，其特征在于：包括收音部和扬声部，所述收音部内设置有收音模块，所述扬声部内设置有扬声模块，所述收音模块和扬声模块之间电性连接，所述收音部和/或扬声部内设置有用于供电的电源模块，所述可读写存储介质置于收音部或扬声部内且与电源模块电性连接。

7.根据权利要求6所述的一种变声程序使用终端，其特征在于：所述收音部和扬声部的体积均小于2cm3。

8.根据权利要求7所述的一种变声程序使用终端，其特征在于：所述收音部内设置有无线信号传输模块，所述扬声部内设置有无线信号接收模块，所述收音部和扬声部内均设置有用于供电的电池。

9.根据权利要求8所述的一种变声程序使用终端，其特征在于：所述可读写存储介质可同时读写存入至少两种变声语音库数据，所述收音部或扬声部上设置有用于转换变声语音数据库的转换开关。

10.根据权利要求9所述的一种变声程序使用终端，其特征在于：所述无线信号传输模块可被外置智能电子设备识别。

技术总结本发明公开了一种变声程序的形成方法、存储介质和使用终端，属于声音处理技术领域，具体包括变声程序的形成方法、用于执行实现变声程序的可读写存储介质和变声程序使用终端。本发明采集使用者的声音数据，在深度学习神经网络的协同下，可以有效的做到对使用者声音特征的识别，从而在需要变声的情况下，可以有效的对使用者输入的声音和其他输入声音进行分离，从而将使用者输入的声音数据进行变声处理，将输入的其他声音数据不做处理，原声输出，有效的确保了变声器的输出效果，让他人不容易轻易察觉到使用者在使用变声器，同时，在本方案中通过将使用终端分为收音部和扬声部，可以减小使用终端的整体体积，实现将使用终端融入衣帽、首饰的可能。技术研发人员：马稚中受保护的技术使用者：温州理工学院技术研发日：技术公布日：2024/3/27