语音合成方法及装置、电子设备和存储介质与流程
- 国知局
- 2024-06-21 11:40:58
本说明书中实施方式关于语音合成领域,特别涉及一种语音合成方法及装置、电子设备和存储介质。
背景技术:
1、语音合成技术是将文本转化为语音的一种技术,可以应用于语音合成助手、智能客服、有声读物、呼叫中心、车载娱乐设备等应用场景。目前,已有很多智能语音交互产品可以提供文本合成语音的能力。
2、但是,现有智能语音交互产品在语音合成过程中对于大段自由文本中的特殊文本,例如:计量单位、范围、~、大于号、小于号等重要文本不能准确识别,从而造成语音合成的准确率较低。
技术实现思路
1、本说明书中多个实施方式提供一种语音合成方法及装置、电子设备和存储介质,能够提高语音合成的准确率。
2、本说明书的一个实施方式提供一种语音合成方法,包括:获取第一文本信息,其中,第一文本信息为待合成语音的文本信息;对第一文本信息进行文本转换,得到转换后的第二文本信息,其中,文本转换是指对第一文本信息中的特定文本区间进行标签标注,以对特定文本区间进行文本替换;以及对第二文本信息进行语音合成,获得对应的音频信息。
3、本说明书的一个实施方式提供一种语音合成装置,包括:获取模块,用于获取第一文本信息,其中,第一文本信息为待合成语音的文本信息;转换模块,用于对第一文本信息进行文本转换,得到转换后的第二文本信息,其中,文本转换是指对第一文本信息的特定文本区间进行标签标注,以对特定文本区间进行文本替换;以及合成模块,用于对第二文本信息进行语音合成,获得对应的音频信息。
4、本说明书的一个实施方式提供一种电子设备,其特征在于,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于执行上述任一实施方式所述的语音合成方法。
5、本说明书的一个实施方式提供一种计算机可读存储介质,其上存储有计算机可执行指令,其特征在于,可执行指令被处理器执行时实现上述任一实施方式所述的语音合成方法。
6、本说明书的一个实施方式提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一实施方式所述的语音合成方法。
7、本说明书提供的多个实施方式,通过获取待合成语音的第一文本信息,对第一文本信息中的特定文本区间进行标签标注得到第二文本信息,可以对特定文本区间(例如特殊数字、字母、符号、单位缩写等)进行文本替换,将其替换成相应中文发音对应的文本,进而能够提高语音合成的准确率。
技术特征:1.一种语音合成方法,其特征在于,包括:
2.根据权利要求1所述的语音合成方法,其特征在于,所述对所述第一文本信息进行文本转换,得到转换后的第二文本信息,包括:
3.根据权利要求1所述的语音合成方法,其特征在于,还包括:
4.根据权利要求3所述的语音合成方法,其特征在于,所述根据所述提示信息,对所述第一文本信息进行文本转换,得到所述第二文本信息,包括:
5.根据权利要求4所述的语音合成方法,其特征在于,还包括:
6.根据权利要求4所述的语音合成方法,其特征在于,所述预训练语言模型包括生成式预训练转换器。
7.根据权利要求1至6中任一项所述的语音合成方法,其特征在于,所述第一文本信息包括完整版药品说明书文本或简化版药品说明书文本,其中,所述语音合成方法还包括:
8.一种语音合成装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1至7中任一项所述的语音合成方法。
技术总结本说明书实施方式提供了一种语音合成方法及装置、电子设备和存储介质。该方法包括:获取第一文本信息,其中,第一文本信息为待合成语音的文本信息;对第一文本信息进行文本转换,得到转换后的第二文本信息,其中,文本转换是指对第一文本信息中的特定文本区间进行标签标注,以对特定文本区间进行文本替换;以及对第二文本信息进行语音合成,获得对应的音频信息,能够提供语音合成的准确率。技术研发人员:孙滋唱受保护的技术使用者:阿里健康科技(中国)有限公司技术研发日:技术公布日:2024/3/31本文地址:https://www.jishuxx.com/zhuanli/20240618/22873.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。