技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音数据处理方法、装置、电子设备及存储介质与流程  >  正文

语音数据处理方法、装置、电子设备及存储介质与流程

  • 国知局
  • 2024-06-21 10:43:52

本发明涉及语音识别,尤其涉及一种语音数据处理方法、装置、电子设备及存储介质。

背景技术:

1、耳机是一种转换单元,可将接收的电信号转化为可听的音频信号。由于耳机便于携带,并且能使用户在不影响旁人的情况下独自聆听音频,因此深受用户的喜爱。如今,随着人们生活品质的不断提升,用户对耳机的音质提出了更高的要求。

2、在相关技术中,很多耳机都会配置有降噪功能,以减少用户在使用耳机时的外界噪声,从而提高用户的使用体验。然而,相关技术中耳机的降噪功能,只能对外界噪声进行处理,却无法对耳机接收到的语音数据进行处理,从而无法满足用户在不同应用场景下的声音需求。

技术实现思路

1、本发明实施例的目的是提供一种语音数据处理方法、装置、电子设备及存储介质,以解决现有技术中的耳机无法满足用户在不同应用场景下的声音需求的技术问题。

2、第一方面,本发明实施例提供了一种语音数据处理方法,包括:

3、响应于用户对象进行的音频模式切换操作,将当前的音频播放模式切换至目标音频模式;

4、基于接收到的原始语音数据,确定所述原始语音数据对应的第一语音特征;

5、根据所述用户对象在所述目标音频模式下确定的语音特征,对所述第一语音特征进行语音特征转换处理,得到所述原始语音数据对应的第二语音特征;

6、对所述原始语音数据和所述第二语音特征进行语音合成处理,得到目标语音数据。

7、第二方面,本发明实施例提供了一种语音数据处理装置,包括:

8、切换模块,用于响应于用户对象进行的音频模式切换操作,将当前的音频播放模式切换至目标音频模式;

9、确定模块,用于基于接收到的原始语音数据,确定所述原始语音数据对应的第一语音特征;

10、转换模块,用于根据所述用户对象在所述目标音频模式下确定的语音特征,对所述第一语音特征进行语音特征转换处理,得到所述原始语音数据对应的第二语音特征;

11、合成模块,用于对所述原始语音数据和所述第二语音特征进行语音合成处理,得到目标语音数据。

12、第三方面,本发明实施例提供了一种电子设备,电子设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的语音数据处理方法中的步骤。

13、第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的语音数据处理方法中的步骤。

14、本发明实施例提供了一种语音数据处理方法、装置、电子设备及存储介质,该方法通过确定当前需要切换的目标音频模式,以及接收到的原始语音数据的第一语音特征,能够根据目标音频模式下对应的语音特征,对第一语音特征进行语音特征转换处理,从而得到原始语音数据对应的第二语音特征,并通过对原始语音数据和第二语音特征进行语音合成处理,能够得到具备第二语音特征的目标语音数据,从而满足用户在不同应用场景下的声音需求,提高用户的使用体验。

技术特征:

1.一种语音数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述用户对象在所述目标音频模式下确定的语音特征,对所述第一语音特征进行语音特征转换处理,得到所述原始语音数据对应的第二语音特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述音频模式切换操作包括第一音频模式切换操作,所述目标音频模式包括情绪调控模式,所述第一语音特征包括第一情绪特征;

4.根据权利要求3所述的方法,其特征在于,所述第二语音特征包括第二情绪特征,所述语音特征转换模型包括情绪特征转换模型;

5.根据权利要求4所述的方法,其特征在于,所述第一情绪特征包括多种情绪;

6.根据权利要求2所述的方法,其特征在于,所述音频模式切换操作包括第二音频模式切换操作,所述目标音频模式包括音色调控模式,所述第一语音特征包括第一音色特征;

7.根据权利要求6所述的方法,其特征在于,所述第二语音特征包括第二音色特征,所述语音特征转换模型包括音色特征转换模型;

8.一种语音数据处理装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法中的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法中的步骤。

技术总结本发明公开了一种语音数据处理方法、装置、电子设备及存储介质,该方法包括响应于用户对象进行的音频模式切换操作,将当前的音频播放模式切换至目标音频模式,基于接收到的原始语音数据,确定原始语音数据对应的第一语音特征,根据用户对象在目标音频模式下确定的语音特征,对第一语音特征进行语音特征转换处理,得到原始语音数据对应的第二语音特征,对原始语音数据和第二语音特征进行语音合成处理,得到目标语音数据。采用本发明实施例,能够对音频设备接收到的语音数据进行处理,以满足用户在不同应用场景下的声音需求,提高用户的使用体验。技术研发人员:杨卉年,李擎宇受保护的技术使用者:OPPO广东移动通信有限公司技术研发日:技术公布日:2024/2/1

本文地址:https://www.jishuxx.com/zhuanli/20240618/21392.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。