语音生成方法、装置、计算机设备和存储介质与流程
- 国知局
- 2024-06-21 11:37:16
本技术涉及计算机,特别是涉及一种语音生成方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、在金融领域中,客户服务是用户与平台之间进行高效交流的重要途径,自动客服可以大大提高用户与平台之间的交流效率,自动客服的客服语音对改善用户体验发挥着重要作用。
2、传统技术主要采用线性预测编码技术(lpc)进行语音合成,线性预测编码技术是一种时间波形的编码技术,线性预测编码技术可以看作对语音的解码和拼接过程,然而,传统技术无法考虑到自然语流中的语音和孤立状况下的语音之间的区别,不利于提高合成的语音的自然度。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高合成的语音的自然度的语音生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种语音生成方法,包括:
3、从预设的语音数据库中查找语音文本对应的音节标记数据;所述预设的语音数据库包括至少一个经过预先音节标记的音节样本;
4、根据所述语音文本,确定所述语音文本对应的韵律参数信息;
5、根据所述韵律参数信息和所述音节标记数据,对所述语音文本的语音波形数据进行修改,得到所述音节标记数据对应的待合成波形数据;
6、根据所述待合成波形数据,生成所述语音文本对应的目标语音。
7、在其中一个实施例中,所述根据所述语音文本,确定所述语音文本对应的韵律参数信息,包括:
8、按照预设的词调规则和语调规则,确定所述语音文本对应的调域信息和调型信息;
9、根据所述语音文本,确定所述语音文本对应的发音时长信息和发音停顿信息;
10、根据所述调域信息、所述调型信息、所述发音时长信息和所述发音停顿信息,确定所述语音文本对应的韵律参数信息。
11、在其中一个实施例中,所述根据所述韵律参数信息和所述音节标记数据,对所述语音文本的语音波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:
12、获取所述语音波形数据中各语音片段的基音周期,根据所述各语音片段的基音周期,确定各语音片段的基音标注位置;
13、根据所述基音周期和所述基音标注位置,生成所述各语音片段的片段波形数据对应的同步波形数据;所述同步波形数据与所述各语音片段的片段波形数据的基音标记相匹配;
14、根据所述韵律参数信息和所述音节标记数据,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据。
15、在其中一个实施例中,所述根据所述各语音片段的基音周期,确定各语音片段的基音标注位置,包括:
16、针对所述各语音片段中的任意一个浊音片段,将所述浊音片段中目标峰值数据对应的坐标位置作为标注点;
17、根据所述浊音片段中目标峰值数据对应的基音周期和所述标注点,确定所述浊音片段对应的候选标注位置;
18、基于动态规划,从所述候选标注位置中筛选出所述浊音片段的基音标注位置;所述基音标注位置满足预设的动态规划路径条件;
19、根据所述浊音片段的基音标注位置,确定所述各语音片段的基音标注位置。
20、在其中一个实施例中,所述根据所述韵律参数信息和所述音节标记数据,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:
21、根据所述韵律参数信息,确定所述音节标记数据对应的基频修改参数和时长修改参数;
22、根据所述基频修改参数和所述时长修改参数,确定所述同步波形数据对应的合成时间信息和分析时间信息;
23、在所述合成时间信息和所述分析时间信息对应的时间点,按照所述基频修改参数和所述时长修改参数,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据。
24、在其中一个实施例中,所述按照所述基频修改参数和所述时长修改参数,对所述同步波形数据进行修改,得到所述音节标记数据对应的待合成波形数据,包括:
25、根据所述基频修改参数和所述时长修改参数,确定所述同步波形数据对应的待修改标注点和待修改标注点间距信息;
26、根据所述待修改标注点和所述待修改标注点间距信息,修改所述同步波形数据的音长和音高,得到所述音节标记数据对应的待合成波形数据。
27、在其中一个实施例中,所述从预设的语音数据库中查找语音文本对应的音节标记数据,包括:
28、获取所述语音文本对应的音节数据;
29、在所述预设的语音数据库中的音节样本中查找与所述音节数据相匹配的候选音节数据;
30、将所述候选音节数据作为所述语音文本对应的音节标记数据。
31、第二方面,本技术还提供了一种语音生成装置,包括:
32、查找模块,用于从预设的语音数据库中查找语音文本对应的音节标记数据;所述预设的语音数据库包括至少一个经过预先音节标记的音节样本;
33、确定模块,用于根据所述语音文本,确定所述语音文本对应的韵律参数信息;
34、修改模块,用于根据所述韵律参数信息和所述音节标记数据,对所述语音文本的语音波形数据进行修改,得到所述音节标记数据对应的待合成波形数据;
35、生成模块,用于根据所述待合成波形数据,生成所述语音文本对应的目标语音。
36、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
37、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
38、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
39、上述语音生成方法、装置、计算机设备、存储介质和计算机程序产品,通过从预设的语音数据库中查找语音文本对应的音节标记数据,从而利用预设的语音数据库中经过预先音节标记的音节样本,确定语音文本中各音节对应的音节信息;根据语音文本,确定语音文本对应的韵律参数信息,从而通过分析语音文本的语义,确定与语音文本的韵律相关的参数信息;根据韵律参数信息和音节标记数据,对语音文本的语音波形数据进行修改,得到音节标记数据对应的待合成波形数据,从而基于韵律参数信息和音节标记数据,针对性地修改语音文本的语音波形数据,得到待合成波形数据;根据待合成波形数据,生成语音文本对应的目标语音,能够通过分析语音文本的韵律特征,结合语音文本在预设的语音数据库中的音节标记数据,对语音文本的各语音段对应的语音波形进行针对性修改,得到待合成语音波形数据,并将待合成语音波形数据拼接和转换,得到目标语音,实现通过分析语音文本的上下文语义,确定语音文本的韵律参数,结合语音文本在预设的语音数据库中的音节标记数据,修改语音文本的各语音段对应的语音波形,并对修改得到的待合成波形进行拼接和转换,得到具有与语音文本的上下文语义相匹配的韵律特征的目标语音,进而提高合成的语音的自然度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22484.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表