语音合成方法及电子设备与流程
- 国知局
- 2024-06-21 11:48:15
本申请涉及终端,尤其涉及一种语音合成方法及电子设备。
背景技术:
1、语音合成又称文语转换,其主要功能是根据文本合成对应的语音,并尽可能使合成的语音有较高的可懂度和自然度。近年来,随着语音合成技术的进步,合成的语音在音质及其自然度上越来越靠近人说话时真实的声音。
2、但是,人说话时是富有独特的风格(例如,情感风格、韵律风格、地域口音风格、音色风格等)的,目前语音合成技术存在局限性,难以合成具有独特的风格对应的语音。
技术实现思路
1、本申请实施例提供一种语音合成方法及电子设备,用户可以在电子设备中自定义风格标签,电子设备能够输出对应于用户自定义的风格标签的合成语音。
2、为达到上述目的,本申请的实施例采用如下技术方案:
3、第一方面,提供了一种语音合成方法,应用于电子设备,该方法包括:
4、电子设备接收输入的第一语音合成指令,获取第一语音合成指令对应的第一风格标签。若电子设备未检测到与第一风格标签存在对应关系的第一文本,则提示用户输入与第一风格标签对应的第一语音。当电子设备接收输入的与第一风格标签对应的第一语音时,检测第一语音对应的第一风格特征,并建立第一风格特征与第一风格标签之间的对应关系,以输出对应于第一风格标签的合成语音。
5、其中,第一风格特征包括第一语音对应的情感特征、韵律特征、地域口音特征、音色特征、节奏特征以及音调特征中的至少一项。
6、上述语音合成方法中,当电子设备接收到用户输入的对应于第一风格标签的第一语音合成指令时,若未检测到与所述第一风格标签存在对应关系的第一文本,则提示用户输入与第一风格标签对应的第一语音。电子设备提取第一语音对应的第一风格特征后,建立第一风格标签与第一风格特征之间的对应关系,以实现用户在该电子设备中添加自定义的第一风格标签。
7、在第一方面的一种可实现方式中,第一风格标签基于第一语音合成指令中的关键词得到。
8、上述语音合成方法中,电子设备接收到第一语音合成指令后,能够通过提取第一语音合成指令中的关键词以获取第一语音合成指令对应的第一风格标签。
9、在第一方面的一种可实现方式中,若电子设备未检测到与所述第一风格标签存在对应关系的第一文本,显示第一界面。其中,第一界面中包括至少一个第二风格标签,第二风格标签与第一风格标签相关联。当电子设备检测到输入的对目标第二风格标签的选中操作时,显示第二界面。第二界面中包括至少一个第二文本,第二文本对应目标第二风格标签。当电子设备检测到用户对目标第二文本的选中操作时,显示第三界面。第三界面用于提示用户输入针对目标第二文本的、且与第一风格标签对应的第一语音。
10、其中,第一界面中还包括第一提示语,第一提示语用于提示用户选择与第一风格标签关联度最高的第二风格标签。第三界面中包括第二提示语和目标第二文本,第二提示语用于提示用户输入针对目标第二文本的、且与第一风格标签对应的第一语音。
11、上述语音合成方法中,电子设备通过显示第一界面,能够提示用户选择与第一风格标签关联度最高的第二风格标签。电子设备通过显示第二界面,能够为用户提供录制第一语音对应的第二文本。电子设备通过显示第三界面,能够提示用户输入针对目标第二文本的、且与第一风格标签对应的第一语音。
12、在第一方面的一种可实现方式中,在用户录制第一语音的过程中,电子设备实时获取第一语音对应的第一风格特征。并显示包括第一风格特征的第四界面。其中,由于电子设备检测到的第一风格特征随着用户在不同时间段输入第一语音时的风格特征不同而实时变化。因此,第四界面中显示的第一风格特征也会随之发生变化,能够提示用户实时调整输入第一语音时对应的第一风格特征。
13、在第一方面的一种可实现方式中,电子设备建立第一风格特征与第一风格标签之间的对应关系后,若接收到输入的对应第一风格标签的第二语音合成指令,并响应于第二语音合成指令,获取第一风格标签对应的文本和第一风格特征。电子设备基于获取到的第一风格标签对应的文本和第一风格特征,合成并输出第二语音。
14、上述语音合成方法中,电子设备建立第一风格特征与第一风格标签之间的对应关系后,即成功在电子设备中添加第一风格标签。当电子设备接收到输入的对应第一风格标签的第二语音合成指令,可以基于第一风格标签获取对应的文本和第一风格特征,并基于获取的文本和第一风格特征,合成并输出第二语音。其中,第二语音对应的文本即为第一风格标签对应的文本,第二语音对应的风格特征即为第一风格特征,第一风格标签对应的文本可以与第二文本相同。能够实现用户在该电子设备中添加自定义的第一风格标签。
15、在第一方面的一种可实现方式中,若电子设备检测到与第一风格标签存在对应关系的第一文本,则基于第一文本和第一风格标签,输出第一文本对应的合成语音。
16、其中,电子设备基于第一文本和第一风格标签,输出第一文本对应的合成语音,包括:
17、电子设备获取与第一风格标签存在对应关系第二风格特征,并基于第一文本和第二风格特征,输出第一文本对应的合成语音。
18、上述语音合成方法中,若电子设备检测到与第一风格标签存在对应关系的第一文本,则获取与第一风格标签存在对应关系的第二风格特征,并基于第一文本和第二风格特征,输出第一文本对应的合成语音。其中,第一风格标签和与第二风格特征之间的对应关系是预先设置的,该合成语音对应的风格特征是第二风格特征。有利于提高用户与电子设备进行交互时的体验感。
19、第二方面,提供了一种电子设备,包括:存储器、一个或多个处理器;存储器和处理器耦合;其中,存储器中存储有计算机程序代码,计算机程序代码包括计算机指令,当计算机指令被处理器执行时,使得电子设备执行上述第一方面任一项所述的语音合成方法。
20、第三方面,提供了一种计算机可读存储介质,包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述第一方面任一项所述的语音合成方法。
21、第四方面,提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述第一方面任一项所述的语音合成方法。
22、可以理解地,上述提供的第二方面所述的电子设备,第三方面所述的计算机可读存储介质,第四方面所述的计算机程序产品所能达到的有益效果,可参考第一方面、第二方面及其任一种可能的设计方式中的有益效果,此处不再赘述。
技术特征:1.一种语音合成方法,应用于电子设备,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述第一风格标签基于所述第一语音合成指令中的关键词得到。
3.根据权利要求1或2所述的方法,其特征在于,所述若未检测到与所述第一风格标签存在对应关系的第一文本,则提示用户输入与所述第一风格标签对应的第一语音,包括:
4.根据权利要求3所述的方法,其特征在于,所述第一界面中还包括第一提示语,所述第一提示语用于提示用户选择与所述第一风格标签关联度最高的所述第二风格标签。
5.根据权利要求3或4所述的方法,其特征在于,所述第三界面中包括第二提示语和所述目标第二文本,所述第二提示语用于提示用户输入针对所述目标第二文本的、且与所述第一风格标签对应的所述第一语音。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述接收输入的与所述第一风格标签对应的所述第一语音,检测所述第一语音对应的第一风格特征,包括:
7.根据权利要求1-6任一项所述的方法,其特征在于,在所述建立所述第一风格特征与所述第一风格标签之间的对应关系之后,还包括:
8.根据权利要求1-7任一项所述的方法,其特征在于,还包括:
9.根据权利要求8所述的方法,其特征在于,若检测到与所述第一风格标签存在对应关系的所述第一文本,则基于所述第一文本和所述第一风格标签,输出所述第一文本对应的合成语音,包括:
10.根据权利要求1-9任一项所述的方法,其特征在于,所述第一风格特征包括所述第一语音对应的情感特征、韵律特征、地域口音特征、音色特征、节奏特征以及音调特征中的至少一项。
11.一种电子设备,其特征在于,包括:存储器、一个或多个处理器;所述存储器与所述处理器耦合;其中,所述存储器中存储有计算机程序代码,所述计算机程序代码包括计算机指令,当所述计算机指令被所述处理器执行时,使得所述电子设备执行如权利要求1-10任一项所述的语音合成方法。
12.一种计算机可读存储介质,其特征在于,包括计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1-10任一项所述的语音合成方法。
13.一种计算机程序产品,其特征在于,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如权利要求1-10任一项所述的语音合成方法。
技术总结本申请提供了一种语音合成方法及电子设备,涉及终端技术领域,用户可以在电子设备中自定义风格标签,电子设备能够输出对应于用户自定义的风格标签的合成语音。该方法中,电子设备接收到输入的第一语音合成指令后,获取第一语音合成指令对应的第一风格标签。若电子设备未检测到与第一风格标签存在对应关系的第一文本,则提示用户输入与第一风格标签对应的第一语音。当电子设备接收到输入的第一语音后,检测第一语音对应的第一风格特征,并建立第一风格特征与第一风格标签之间的对应关系,以输出对应于第一风格标签的合成语音。本方法应用在电子设备进行语音合成的过程中。技术研发人员:周博林受保护的技术使用者:华为技术有限公司技术研发日:技术公布日:2024/5/6本文地址:https://www.jishuxx.com/zhuanli/20240618/23661.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表