文本音素标注信息生成方法、装置和计算机设备与流程
- 国知局
- 2024-06-21 11:36:46
本技术涉及计算机,特别是涉及一种文本音素标注信息生成方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、语音合成可以将文字信息转化为语音,语音合成技术可以广泛应用于各个领域,例如:在金融领域中,语音合成可以生成用于与客户交流和沟通的客服语音。
2、传统技术主要利用语音合成系统(tts)进行语音合成,语音合成系统可以根据文本的韵律特征调整语音波形,然而,传统技术调整语音波形时所依据的基音周期等信息会影响语音调整的准确性,当基音周期等信息存在较大误差时,利用传统技术合成的语音会在重音、韵律和情绪表达等方面存在不足,不利于提高语音合成的自然度。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高语音合成的自然度的文本音素标注信息生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种文本音素标注信息生成方法,包括:
3、对语音文本进行分词,得到所述语音文本对应的分词结果;
4、按照预设的韵律分析规则,根据所述分词结果对应的语法信息,确定所述语音文本对应的韵律边界信息;
5、获取所述语音文本对应的注音信息,根据所述韵律边界信息和所述注音信息,确定所述语音文本对应的音素标注信息;所述音素标注信息用于生成针对所述语音文本的语音。
6、在其中一个实施例中,所述对语音文本进行分词,得到所述语音文本对应的分词结果,包括:
7、根据预设的词典,将所述语音文本转换为标准文本;
8、根据所述预设的词典,从所述标准文本中筛选出词典词和单字,得到候选词集;所述候选词集包括所述词典词和所述单字;
9、根据所述候选词集,对所述标准文本进行分词,得到所述语音文本对应的分词结果。
10、在其中一个实施例中,所述按照预设的韵律分析规则,根据所述分词结果对应的语法信息,确定所述语音文本对应的韵律边界信息,包括:
11、根据所述分词结果对应的语法信息,确定所述分词结果中的语法词;
12、根据所述分词结果对应的语法信息,确定所述语法词对应的语法树;
13、按照所述预设的韵律分析规则,根据所述语法词和所述语法树,确定所述语音文本对应的韵律边界信息。
14、在其中一个实施例中,所述方法还包括:
15、获取样本文本的语法词和样本文本的语法树;
16、根据所述样本文本的语法词和所述样本文本的语法树,修改所述预设的韵律分析规则,得到修改后韵律分析规则。
17、在其中一个实施例中,所述获取所述语音文本对应的注音信息,包括:
18、针对所述语音文本中的任意一个字,在所述任意一个字不是多音字的情况下,获取所述任意一个字在所述语音文本中的临近单元对应的文本特征;
19、根据所述文本特征,确定所述任意一个字对应的读音信息;
20、根据所述任意一个字对应的读音信息,确定所述语音文本对应的注音信息。
21、在其中一个实施例中,所述获取所述语音文本对应的注音信息,还包括:
22、针对所述语音文本中的任意一个字,在所述任意一个字不是多音字的情况下,获取所述任意一个字在所述语音文本中的位置信息;
23、根据所述位置信息,确定所述任意一个字对应的读音信息;
24、根据所述任意一个字对应的读音信息,确定所述语音文本对应的注音信息。
25、在其中一个实施例中,所述获取所述语音文本对应的注音信息,还包括:
26、针对所述语音文本中的任意一个字,在所述任意一个字不是多音字的情况下,获取所述语音文本对应的标点符号信息;
27、根据所述标点符号信息,确定所述任意一个字对应的读音信息;
28、根据所述任意一个字对应的读音信息,确定所述语音文本对应的注音信息。
29、在一些实施例中,所述根据所述韵律边界信息和所述注音信息,确定所述语音文本对应的音素标注信息,包括:
30、根据所述韵律边界信息和所述注音信息,确定所述语音文本中的各音素对应的声韵母信息;所述声韵母信息包括所述各音素的发音基元信息;
31、根据所述韵律边界信息和所述注音信息,确定所述语音文本中的各音节对应的音节信息;所述音节信息包括所述各音节的音素信息、声调信息和位置信息;
32、根据所述韵律边界信息和所述注音信息,确定所述语音文本中的各词对应的词信息;所述词信息包括所述各词的词性信息、音节数量信息和位置信息;
33、根据所述韵律边界信息和所述注音信息,确定所述语音文本中的各韵律词对应的韵律词信息;所述韵律词信息包括所述各韵律词的音节数量信息、词数量信息和位置信息;
34、根据所述韵律边界信息和所述注音信息,确定所述语音文本中的各韵律短语对应的韵律短语信息;所述韵律短语信息包括所述各韵律短语的声调信息、音节数量信息、词数量信息、韵律词数量信息和位置信息;
35、根据所述韵律边界信息和所述注音信息,确定所述语音文本中的各语句对应的语句信息;所述语句信息包括所述各语句的声调信息、音节数量信息、词数量信息、韵律词数量信息、韵律短语数量信息;
36、根据所述声韵母信息、所述音节信息、所述词信息、所述韵律词信息、所述韵律短语信息和所述语句信息中的至少一种,确定所述语音文本对应的音素标注信息。
37、第二方面,本技术还提供了一种文本音素标注信息生成装置,包括:
38、分词模块,用于对语音文本进行分词,得到所述语音文本对应的分词结果;
39、分析模块,用于按照预设的韵律分析规则,根据所述分词结果对应的语法信息,确定所述语音文本对应的韵律边界信息;
40、确定模块,用于获取所述语音文本对应的注音信息,根据所述韵律边界信息和所述注音信息,确定所述语音文本对应的音素标注信息;所述音素标注信息用于生成针对所述语音文本的语音。
41、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
42、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
43、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
44、上述文本音素标注信息生成方法、装置、计算机设备、存储介质和计算机程序产品,通过对语音文本进行分词,得到语音文本对应的分词结果,从而通过分词,将语音文本划分为若干词语,便于后续对语音文本的韵律分析和音素标注;按照预设的韵律分析规则,根据分词结果对应的语法信息,确定语音文本对应的韵律边界信息,从而在预设的韵律分析的基础上,分析分词结果对应的语法信息,得到准确的韵律边界信息;获取语音文本对应的注音信息,根据韵律边界信息和注音信息,确定语音文本对应的音素标注信息,从而利用韵律边界信息和注音信息,确定语音文本中的各音素对应的音素标注信息,进而利用音素标注信息生成针对语音文本的语音,能够通过对语音文本进行分词和韵律分析,结合分词结果对应的语法信息,准确获取语音文本对应的韵律边界信息。并结合语音文本对应的注音信息,分析语音文本中的各音素,得到针对语音文本中各音素的准确的音素标注信息,实现通过分析语音文本的韵律特征,结合语音文本的上下文韵律,对语音文本中的各音素进行准确的标注,得到用于生成对应的语音的音素标注信息,从而基于音素标注信息,生成能够体现语音文本上下文韵律特征的语音,进而提高语音合成的自然度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22408.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表