技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音数据处理方法、装置及系统与流程 > 正文

语音数据处理方法、装置及系统与流程

国知局
2024-06-21 11:25:59

本申请涉及音频处理，尤其涉及一种语音数据处理方法、装置及系统。

背景技术：

1、随着全球化进程的不断发展与进步，位于不同地区或国家的多个用户通过语音协同工作，已成为当前主流的全球化工作模式之一。然而，由于不同地区或不同国家的用户的讲话语言往往不同，例如，有的用户讲英文、有的用户讲日文、有的用户讲四川方言、有的用户讲普通话等。在此情况下，语音转译成为了必不可少的处理环节。然而，目前的语音转译通常是在语音采集端执行，不仅转译效率低，而且转译结果通常是一成不变的，听者不能真切的体会到讲话人的讲话情绪，如音调、语速等，因此可能会影响后续的有效交流。

技术实现思路

1、本申请提供了一种语音数据处理方法、装置及系统，以提升语音转译效率并实现语音转译结果的动态性。

2、第一方面，本申请实施例提供了一种语音数据处理方法，应用于服务端，包括：

3、确定至少一个语音播放设备当前播放语音数据所采用的目标语言；

4、若从语音收录设备获取到待处理的原始语音数据，则将所述原始语音数据输入声纹识别模型中进行声纹识别处理，得到所述原始语音数据中发音用户的发音特征；

5、根据所述目标语言和所述发音特征，对所述原始语音数据进行转换处理，得到至少一个目标语音数据；

6、将所述目标语音数据发送给对应的所述语音播放设备。

7、可以看出，本申请实施例中，服务端确定至少一个语音播放设备当前播放语音数据所采用的目标语言；若从语音收录设备获取到待处理的原始语音数据，则将原始语音数据输入声纹识别模型中进行声纹识别处理，得到原始语音数据中发音用户的发音特征；根据目标语言和发音特征，对原始语音数据进行转换处理，得到至少一个目标语音数据。该语音处理过程中，由于是服务端进行语音转译处理，而服务端相较于语音采集端而言数据处理效率高，因此提升了语音转译效率。再者，通过识别发音用户的发音特征，并基于该发音特征和各语音播放设备当前播放语音数据所采用的目标语言，将原始语音数据转换为目标语音数据，使得目标语音数据具备发音特征和对应的目标语言，由此，语音播放设备基于目标语音数据进行语音播放，不仅能够使听者听到的语音数据在发音用户的音调、语速等方面与原始语音数据更接近，提升听者的收听体验，而且实现了语音转译效果的动态性，更有利于后续听者与发音用户进行有效沟通。

8、第二方面，本申请实施例提供了一种语音数据处理装置，包括：

9、确定模块，用于确定至少一个语音播放设备当前播放语音数据所采用的目标语言；

10、识别模块，用于若从语音收录设备获取到待处理的原始语音数据，则将所述原始语音数据输入声纹识别模型中进行声纹识别处理，得到所述原始语音数据中发音用户的发音特征；

11、转换模块，用于根据所述目标语言和所述发音特征，对所述原始语音数据进行转换处理，得到至少一个目标语音数据；

12、发送模块，用于将所述目标语音数据发送给对应的所述语音播放设备。

13、第三方面，本申请实施例提供了一种语音数据处理系统，包括：至少一个语音收录设备、服务端和至少一个语音播放设备；

14、所述语音收录设备，用于收录待处理的原始语音数据；

15、所述服务端，用于确定所述语音播放设备当前播放语音数据所采用的目标语言；若从所述语音收录设备获取到所述原始语音数据，则将所述原始语音数据输入声纹识别模型中进行声纹识别处理，得到所述原始语音数据中发音用户的发音特征；根据所述目标语言和所述发音特征，对所述原始语音数据进行转换处理，得到至少一个目标语音数据；将所述目标语音数据发送给对应的所述语音播放设备；

16、所述语音播放设备，接收所述服务端发送的所述目标语音数据，并基于所述目标语音数据进行语音播放处理。

17、第四方面，本申请实施例提供了一种电子设备，包括：

18、处理器；以及，被安排成存储计算机可执行指令的存储器，所述可执行指令被配置由所述处理器执行，所述可执行指令包括用于执行上述第一方面提供的语音数据处理方法中的步骤。

19、第五方面，本申请实施例提供了一种存储介质，所述存储介质用于存储计算机可执行指令，所述可执行指令使得计算机执行上述第一方面提供的语音数据处理方法中的步骤。

技术特征：

1.一种语音数据处理方法，其特征在于，应用于服务端，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标语言和所述发音特征，对所述原始语音数据进行转换处理，得到至少一个目标语音数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述原始语言和所述目标语言，对所述原始语音数据进行文本转换处理，得到至少一个目标文本，包括：

4.根据权利要求2所述的方法，其特征在于，所述根据所述原始语言和所述目标语言，对所述原始语音数据进行文本转换处理，得到至少一个目标文本，包括：

5.根据权利要求2所述的方法，其特征在于，所述根据所述发音特征和所述目标文本，进行语音合成处理，得到至少一个目标语音数据，包括：

6.根据权利要求2所述的方法，其特征在于，所述确定所述原始语音数据所采用的原始语言，包括：

7.根据权利要求1所述的方法，其特征在于，所述确定至少一个语音播放设备当前播放语音数据所采用的目标语言，包括：

8.根据权利要求1所述的方法，其特征在于，所述对所述原始语音数据进行转换处理，得到至少一个目标语音数据之后，所述方法还包括：

9.一种语音数据处理装置，其特征在于，包括：

10.一种语音数据处理系统，其特征在于，包括：至少一个语音收录设备、服务端和至少一个语音播放设备；

11.一种电子设备，其特征在于，包括：

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机可执行指令，所述可执行指令使得计算机执行如1-8任一项所述的语音数据处理方法。

技术总结本申请实施例提供了一种语音数据处理方法、装置及系统，其中方法包括：服务端确定至少一个语音播放设备当前播放语音数据所采用的目标语言；若从语音收录设备获取到待处理的原始语音数据，则将原始语音数据输入声纹识别模型中进行声纹识别处理，得到原始语音数据中发音用户的发音特征；根据目标语言和发音特征，对原始语音数据进行转换处理，得到至少一个目标语音数据；将目标语音数据发送给对应的语音播放设备。通过本申请实施例，提升了语音转译效率并实现了语音转译结果的动态性。技术研发人员：迟海波,郝征鹏,蒋宁受保护的技术使用者：马上消费金融股份有限公司技术研发日：技术公布日：2024/2/6