技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音生成方法、装置、电子设备及存储介质与流程 > 正文

语音生成方法、装置、电子设备及存储介质与流程

国知局
2024-06-21 11:27:11

本公开涉及音视频处理，尤其涉及语音生成方法、装置、电子设备和计算机存储介质。

背景技术：

1、随着短视频行业的发展，出现了tts(text to speech，从文本到语音)技术，该tts技术可以将文本文字自动转换为语音输出，解决了传统语音录制方法中需要人工朗读、语音收录的形式，导致消耗大量的时间成本的问题。

2、目前的语音生成方法中，基于tts技术进行文本语音转换时，用户可以在现有提供的几种音色类型的语音包中进行选择，选择目标音色类型的语音包进行文字语音间的转换。

3、然而，目前的语音生成方法中，用户基于现有语音包进行文字转换，语音生成方式较为单一，且灵活性较差。

技术实现思路

1、本公开提供一种语音生成方法、装置、电子设备和计算机存储介质，以至少解决相关技术中语音生成方式较为单一，且灵活性较差的问题。本公开的技术方案如下：

2、根据本公开实施例的第一方面，提供一种语音生成方法，包括：

3、响应于用户触发的语音生成请求，展示语音生成页面；所述语音生成页面中包含多种类型的语音标识；所述多种类型的语音标识中包含定制语音标识；

4、响应于针对所述定制语音标识的触发操作，展示所述定制语音标识对应的定制语音包；所述定制语音包基于收录的所述用户的语音数据生成，用于将待处理文本转换为满足用户语音特征的目标语音。

5、在一示例性实施例中，所述响应于针对所述定制语音标识的触发操作，展示所述定制语音标识对应的定制语音包之前，所述方法还包括：

6、响应于针对所述定制语音标识的触发操作，展示定制语音页面；所述定制语音页面中包含语音包定制选项；

7、响应于对所述语音包定制选项的触发操作，展示用于生成定制语音包的待录制文本；

8、基于收录的所述待录制文本的语音数据，生成所述定制语音包。

9、在一示例性实施例中，所述响应于对所述语音包定制选项的触发操作，展示用于生成定制语音包的待录制文本，包括：

10、响应于对所述语音包定制选项的触发操作，展示定制语音提示信息以及启动定制选项；

11、响应于对所述启动定制选项的触发操作，展示包含定制语音包的待录制文本的语音包录制页面。

12、在一示例性实施例中，所述语音包录制页面中还包含收录选项以及收录进度条，所述响应于对所述启动定制选项的触发操作，展示包含定制语音包的待录制文本的语音包录制页面之后，所述方法还包括：

13、响应于对第一待录制文本的收录选项的触发操作，收录所述第一待录制文本对应的语音数据；

14、在所述第一待录制文本的语音数据收录完成之后，更新收录进度条中的收录进度并展示收录跳转选项，所述收录跳转选项与所述收录进度条存在关联关系，用于触发更新第一待录制文本以及更新所述收录进度条中展示的收录进度。

15、在一示例性实施例中，所述基于收录的所述待录制文本的语音数据，生成所述定制语音包，包括：

16、在收录完成全部的待测试文本对应的语音数据之后，展示语音包生成进度页面；

17、基于所述语音包生成进度页面中包含的生成进度信息以及进度动画特效，反映基于收录的全部的所述待录制文本的语音数据，生成所述定制语音包的过程。

18、在一示例性实施例中，其特征在于，所述基于收录的所述待录制文本的语音数据，生成所述定制语音包之后，所述方法还包括：

19、在语音包配置页面中，响应于对所述定制语音包的配置操作，将所述定制语音包以及所述定制语音包对应的配置信息进行输出展示。

20、在一示例性实施例中，所述响应于针对所述定制语音标识的触发操作，展示所述定制语音标识对应的定制语音包之后，所述方法还包括：

21、响应于对所述定制语音标识对应的定制语音包中第一定制语音包的选中操作，将待处理文本转换为满足所述第一定制语音包中第一用户语音特征的目标语音。

22、根据本公开实施例的第二方面，提供一种语音生成装置，所述装置包括：

23、第一展示单元，被配置为执行响应于用户触发的语音生成请求，展示语音生成页面；所述语音生成页面中包含多种类型的语音标识；所述多种类型的语音标识中包含定制语音标识；

24、第二展示单元，被配置为执行响应于针对所述定制语音标识的触发操作，展示所述定制语音标识对应的定制语音包；所述定制语音包基于收录的所述用户的语音数据生成，用于将待处理文本转换为满足用户语音特征的目标语音。

25、在一示例性实施例中，所述装置还包括：

26、第三展示单元，被配置为执行响应于针对所述定制语音标识的触发操作，展示定制语音页面；所述定制语音页面中包含语音包定制选项；

27、第四展示单元，被配置为执行响应于对所述语音包定制选项的触发操作，展示用于生成定制语音包的待录制文本；

28、第一生成单元，被配置为执行基于收录的所述待录制文本的语音数据，生成所述定制语音包。

29、在一示例性实施例中，第四展示单元，还包括：

30、第一展示子单元，被配置为执行响应于对所述语音包定制选项的触发操作，展示定制语音提示信息以及启动定制选项；

31、第二展示子单元，被配置为执行响应于对所述启动定制选项的触发操作，展示包含定制语音包的待录制文本的语音包录制页面。

32、在一示例性实施例中，所述装置还包括：

33、收录单元，被配置为执行响应于对第一待录制文本的收录选项的触发操作，收录所述第一待录制文本对应的语音数据；

34、更新单元，被配置为执行在所述第一待录制文本的语音数据收录完成之后，更新收录进度条中的收录进度并展示收录跳转选项，所述收录跳转选项与所述收录进度条存在关联关系，用于触发更新第一待录制文本以及更新所述收录进度条中展示的收录进度。

35、在一示例性实施例中，第一生成单元，还包括：

36、第三展示子单元，被配置为执行在收录完成全部的待测试文本对应的语音数据之后，展示语音包生成进度页面；

37、第四展示子单元，被配置为执行基于所述语音包生成进度页面中包含的生成进度信息以及进度动画特效，反映基于收录的全部的所述待录制文本的语音数据，生成所述定制语音包的过程。

38、在一示例性实施例中，所述装置还包括：

39、配置单元，被配置为执行在语音包配置页面中，响应于对所述定制语音包的配置操作，将所述定制语音包以及所述定制语音包对应的配置信息进行输出展示。

40、在一示例性实施例中，所述装置还包括：

41、第二生成单元，被配置为执行响应于对所述定制语音标识对应的定制语音包中第一定制语音包的选中操作，将待处理文本转换为满足所述第一定制语音包中第一用户语音特征的目标语音。

42、根据本公开实施例的第三方面，提供一种电子设备，包括：

43、处理器；

44、用于存储所述处理器可执行指令的存储器；

45、其中，所述处理器被配置为执行所述指令，以实现如上述第一方面中任一项所述的语音生成方法。

46、根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如上述第一方面中任一项所述的语音生成方法。

47、根据本公开实施例的第五方面，提供一种计算机程序产品，所述指令被电子设备的处理器执行时，使得所述电子设备能够执行上述第一方面中任一项所述的语音生成方法。

48、本公开的实施例提供的技术方案至少带来以下有益效果：

49、通过在语音生成页面中新增定制语音标识，展示新增的定制语音功能，使得在将待处理文本转换为目标语音的过程中，可以基于定制语音功能提供的定制语音包生成满足用户语音特征的目标语音，丰富语音生成的方式，提高了语音生成的灵活性。

50、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

标签：电子设备语音装置技术资料下载

本文地址：https://www.jishuxx.com/zhuanli/20240618/21613.html

上一篇
一种发动机声品质确定方法和系统与流程

下一篇
返回列表

语音生成方法、装置、电子设备及存储介质与流程

相关技术

最新技术

技术分类