技术新讯 > 乐器声学设备的制造及制作,分析技术 > 词库生成方法、词库生成装置、电子设备及可读存储介质与流程  >  正文

词库生成方法、词库生成装置、电子设备及可读存储介质与流程

  • 国知局
  • 2024-06-21 11:48:29

本申请属于语音合成,尤其涉及一种词库生成方法、词库生成装置、电子设备及可读存储介质。

背景技术:

1、语音合成,又称文语转换(text to speech)技术,是一种可以将文本转换成相应语音的技术。在语音合成的过程中,通常包括三个部分:一是文本分析,对输入的文本进行正则化,将字母、数字、符号等转换为对应的汉字,随后通过分词将句子拆分为词组和单字,再通过查字典表找到词组或单字对应的音素;二是声学模型,将音素转换为语音特征;三是声码器,将语音特征转换为声音波形并输出。

2、其中,上述字典表是词组或单字到音素的映射表,通常能够覆盖日常词汇。但是,在实际的应用场景中,可能会遇到一些多音词或专用词,则需要增加或者修改词汇,增加或者修改的词汇可以称之为“自定义词汇”。但在增加或者修改词汇时,通常需要将程序服务停掉,由开发人员增加或者修改,然后重启程序服务,操作较为繁琐。如果自定义词汇比较多,则会耗费大量的人力和时间成本。

技术实现思路

1、本申请实施例提供了一种词库生成方法、词库生成装置、电子设备及可读存储介质,以提高词库的生成效率,降低人力和时间成本。

2、第一方面,本申请实施例提供了一种词库生成方法,所述词库生成方法包括:

3、获取自定义词汇和第一汉语拼音,所述第一汉语拼音是所述自定义词汇的汉语拼音;

4、基于所述第一汉语拼音,确定对应的第一信息,所述第一信息包括所述第一汉语拼音对应的音素和声调标志;

5、基于所述自定义词汇和所述第一信息,生成自定义词库。

6、第二方面,本申请实施例提供了一种词库生成装置,所述词库生成装置包括:

7、信息获取模块,用于获取自定义词汇和第一汉语拼音,所述第一汉语拼音是所述自定义词汇的汉语拼音;

8、信息确定模块,用于基于所述第一汉语拼音,确定对应的第一信息,所述第一信息包括所述第一汉语拼音对应的音素和声调标志;

9、词库生成模块,用于基于所述自定义词汇和所述第一信息,生成自定义词库。

10、第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述词库生成方法的步骤。

11、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述词库生成方法的步骤。

12、第五方面,本申请实施例提供了一种计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行如上述第一方面所述词库生成方法的步骤。

13、由上可见,本方案通过获取自定义词汇和该自定义词汇的汉语拼音,并基于自定义词汇的汉语拼音确定该汉语拼音对应的音素和声调标志,可以基于自定义词汇和上述音素和声调标志生成自定义词库。在上述过程中,只需用户提供自定义词汇和对应的汉语拼音,即可确定该汉语拼音对应的音素和声调标志,从而生成自定义词库,无需开发人员参与,操作简单,提高了词库的生成效率,降低了人力和时间成本。

技术特征:

1.一种词库生成方法,其特征在于,所述词库生成方法包括:

2.根据权利要求1所述的词库生成方法,其特征在于,所述基于所述第一汉语拼音,确定对应的第一信息,包括:

3.根据权利要求2所述的词库生成方法,其特征在于,所述词库生成方法还包括:

4.根据权利要求2所述的词库生成方法,其特征在于,所述基于所述第一汉语拼音和第一映射关系,确定所述第一信息,包括:

5.根据权利要求1至4任一项所述的词库生成方法,其特征在于,在所述自定义词汇不为单字的情况下,所述词库生成方法还包括:

6.根据权利要求5所述的词库生成方法,其特征在于,在生成自定义词库之后,还包括:

7.根据权利要求1至4任一项所述的词库生成方法,其特征在于,所述自定义词库包括单字词库和词组词库,所述基于所述自定义词汇和所述第一信息,生成自定义词库,包括:

8.一种词库生成装置,其特征在于,所述词库生成装置包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述词库生成方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述词库生成方法的步骤。

技术总结本申请适用于语音合成技术领域,提供了一种词库生成方法、词库生成装置、电子设备及可读存储介质。所述词库生成方法包括:获取自定义词汇和第一汉语拼音,所述第一汉语拼音是所述自定义词汇的汉语拼音;基于所述第一汉语拼音,确定对应的第一信息,所述第一信息包括所述第一汉语拼音对应的音素和声调标志;基于所述自定义词汇和所述第一信息,生成自定义词库。通过本申请可提高词库的生成效率,降低人力和时间成本。技术研发人员:郑泽鸿,杨显杰,罗沛鹏,李鹏辉受保护的技术使用者:深圳市优必选科技股份有限公司技术研发日:技术公布日:2024/5/6

本文地址:https://www.jishuxx.com/zhuanli/20240618/23682.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。