技术新讯 > 乐器声学设备的制造及制作,分析技术 > 多音英文单词的发音转换方法、装置及存储介质与流程 > 正文

多音英文单词的发音转换方法、装置及存储介质与流程

国知局
2024-06-21 11:52:19

本申请涉及语音合成，尤其涉及一种多音英文单词的发音转换方法、装置及存储介质。

背景技术：

1、在英文语音合成(english text to speech，en-tts)的过程中，通常包括三个部分：一是文本分析，对输入的英文句子进行正则化，将字母、数字、符号等转换为对应的英语单词或词组，随后通过查字典表找到每个单词对应的英文音素，二是声学模型，将英文音素通过声学时长模型转为语音特征，三是声码器，将语音特征转化为声音波形并输出。

2、其中的字典表，是英语单词到英文音素的映射表，通常能够覆盖日常词汇，但是，英语单词的发音不是唯一的，有些单词还有美式发音和英式发音。而目前市面上的语音合成系统，都是按照固定的字典表进行合成发音，也就是只会默认其中一个读音，但如果用户想让其朗读为另外一个读音，则只能联系开发商进行修改，显得非常麻烦。

技术实现思路

1、本申请提供了一种多音英文单词的发音转换方法、装置及存储介质，以解决如何方便的使语音合成系统将多音英文单词发出用户期望的发音。

2、第一方面，本申请提供了一种多音英文单词的发音转换方法，所述方法包括：

3、获取多音英文单词的目标国际音标；其中，所述目标国际音标为所述多音英文单词的多种发音中的一种；

4、基于语音转录码将所述目标国际音标转换为目标英文音素；

5、将所述目标英文音素写入语音合成系统的自定义发音库，以使所述语音合成系统将所述多音英文单词的默认发音转换为按照所述目标国际音标发音。

6、可选地，获取多音英文单词的目标国际音标，包括：

7、获取用户按照第一预设格式输入的自定义词组；其中，所述自定义词组包括所述多音英文单词、语言种类和英文音标；

8、在所述语言种类为英文且所述英文音标为所述多音英文单词的一种发音的情况下，确定所述英文音标为所述目标国际音标。

9、可选地，基于语音转录码将所述目标国际音标转换为目标英文音素，包括：

10、将所述目标国际音标中的特殊符号剔除，得到第一音标；

11、将所述第一音标按照元音和辅音进行切分，并将长元音和双元音进行合并，得到第二音标；其中，所述第二音标包括重音标识和切分合并后的多个子音标；

12、根据所述语音转录码对所述子音标进行音标替换，得到第一音素；其中，所述第一音素包括多个子音素；所述子音素中的元音音素携带目标标识，所述目标标识表征所述元音音素包括至少一种重音发音；

13、从所述多个子音素中确定所述重音标识对应的目标子音素；

14、根据所述重音标识对所述目标子音素中的元音音素的所述目标标识进行替换，得到所述目标英文音素。

15、可选地，将所述目标英文音素写入语音合成系统的自定义发音库，包括：

16、基于所述目标英文音素、所述多音英文单词和英语语言标识生成目标词条；

17、将所述目标词条写入所述语音合成系统的所述自定义发音库。

18、可选地，将所述目标英文音素写入语音合成系统的自定义发音库之后，所述方法还包括：

19、对输入的英文语句进行拆分，得到多个目标单词；

20、对每个所述目标单词执行如下处理：判断所述自定义发音库是否包含所述目标单词；若包含，从所述自定义发音库获取所述目标单词对应的目标英文音素；若不包含，从默认发音库获取所述目标单词对应的默认音素；

21、根据所有所述目标英文音素和所述默认音素生成所述英文语句的音素集合。

22、可选地，对输入的英文语句进行拆分，得到多个目标单词之前，所述方法还包括：

23、获取输入的目标英文语句；

24、对所述目标英文语句进行文本正则处理，得到所述英文语句。

25、可选地，所述语音转录码包括arpabet语音转录码。

26、第二方面，本申请提供了一种多音英文单词的发音转换装置，所述装置包括：

27、获取模块，用于获取多音英文单词的目标国际音标；其中，所述目标国际音标为所述多音英文单词的多种发音中的一种；

28、转换模块，用于基于语音转录码将所述目标国际音标转换为目标英文音素；

29、写入模块，用于将所述目标英文音素写入语音合成系统的自定义发音库，以使所述语音合成系统将所述多音英文单词的默认发音转换为按照所述目标国际音标发音。

30、第三方面，本申请提供了一种电子装置，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

31、存储器，用于存放计算机程序；

32、处理器，用于执行存储器上所存放的程序时，实现第一方面任一项实施例所述的多音英文单词的发音转换方法。

33、第四方面，本申请提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的多音英文单词的发音转换方法。

34、本申请实施例提供的上述技术方案与现有技术相比具有如下优点：本申请实施例提供的该方法，获取多音英文单词的目标国际音标；其中，所述目标国际音标为所述多音英文单词的多种发音中的一种；基于语音转录码将所述目标国际音标转换为目标英文音素；将所述目标英文音素写入语音合成系统的自定义发音库。该方法通过语音转录码将用户期望的多音英文单词的目标国际音标转换为目标英文音素，再将目标英文音素写入语音合成系统的自定义发音库，从而使语音合成系统将多音英文单词的默认发音转换为按照用户期望的目标国际音标发音，提高了用户在使用语音合成系统的体验感。

技术特征：

1.一种多音英文单词的发音转换方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，获取多音英文单词的目标国际音标，包括：

3.根据权利要求1所述的方法，其特征在于，基于语音转录码将所述目标国际音标转换为目标英文音素，包括：

4.根据权利要求1所述的方法，其特征在于，将所述目标英文音素写入语音合成系统的自定义发音库，包括：

5.根据权利要求4所述的方法，其特征在于，将所述目标英文音素写入语音合成系统的自定义发音库之后，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，对输入的英文语句进行拆分，得到多个目标单词之前，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述语音转录码包括arpabet语音转录码。

8.一种多音英文单词的发音转换装置，其特征在于，所述装置包括：

9.一种电子装置，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的多音英文单词的发音转换方法。

技术总结本申请涉及一种多音英文单词的发音转换方法、装置及存储介质，方法包括：获取多音英文单词的目标国际音标；其中，所述目标国际音标为所述多音英文单词的多种发音中的一种；基于语音转录码将所述目标国际音标转换为目标英文音素；将所述目标英文音素写入语音合成系统的自定义发音库，以使所述语音合成系统将所述多音英文单词的默认发音转换为按照所述目标国际音标发音。该方法通过语音转录码将用户期望的多音英文单词的目标国际音标转换为目标英文音素，再将目标英文音素写入语音合成系统的自定义发音库，从而使语音合成系统将多音英文单词的默认发音转换为按照用户期望的目标国际音标发音，提高了用户在使用语音合成系统的体验感。技术研发人员：郑泽鸿,杨显杰,罗沛鹏,李鹏辉受保护的技术使用者：深圳市优必选科技股份有限公司技术研发日：技术公布日：2024/5/16