技术新讯 > 乐器声学设备的制造及制作,分析技术 > 方法、服务器、客户端和交互系统与流程 > 正文

方法、服务器、客户端和交互系统与流程

国知局
2024-06-21 10:39:02

本发明涉及语音，特别涉及一种方法、服务器、客户端和交互系统。

背景技术：

1、随着科技发展，语音交互逐渐称为交互方式中较为重要的一种。而在语音交互过程中，相关技术通常是将文本全部合成为音频后再进行播放，这就导致了在文本为长文本的情况下，合成音频的时间较长，合成效率低。

技术实现思路

1、本发明的实施方式提供一种方法、服务器、客户端和交互系统。

2、本发明实施方式的一种语音合成方法，用于服务器，语音合成方法包括：

3、根据预设标准将整段文本信息分段，获取若干分段文本信息和顺序信息，所述顺序信息表示若干所述分段文本信息的顺序关系；

4、根据所述顺序信息，将所述分段文本信息加入多个合成任务，合成对应的分段音频信息；

5、根据所述顺序信息，将所述分段音频信息注入缓存区。

6、在某些实施方式中，根据所述顺序信息，将所述分段文本信息加入多个合成任务，合成对应的分段音频信息，包括：

7、开辟多个所述合成任务，所述合成任务用于将一所述分段文本信息合成为一所述分段音频信息；

8、根据所述顺序信息，将若干所述分段文本信息顺序加入空闲的合成任务，合成对应的分段音频信息。

9、在某些实施方式中，所述语音合成方法还包括：

10、在多个所述合成任务开始合成所述分段音频信息的情况下，创建音频播放链接。

11、在某些实施方式中，所述语音合成方法还包括：

12、在获取到首位分段音频信息的情况下，开始将所述分段音频信息注入所述缓存区，并将所述音频播放链接返回客户端，所述首位分段音频信息表示在所述顺序信息中排在第一位的所述分段音频信息。

13、本发明实施方式的一种语音播放方法，用于客户端，语音播放方法包括：根据音频播放链接，下载分段音频信息，其中，所述音频播放链接是由服务器确定的，所述分段音频信息是由所述服务器合成的；

14、将下载的所述分段音频信息存入缓冲区；

15、播放所述缓冲区内的分段音频信息。

16、在某些实施方式中，所述根据所述音频播放链接，下载所述分段音频信息，还包括：

17、根据与所述服务器约定的分段下载长度和所述音频播放链接，下载所述分段音频信息，其中，所述分段下载长度小于或等于所有所述分段音频信息的长度中的最小值。

18、在某些实施方式中，所述客户端包括多个所述缓冲区，多个所述缓冲区具有播放顺序，

19、所述将下载的所述分段音频信息存入缓冲区，包括：

20、将下载的所述分段音频信息存入空闲的缓冲区；

21、所述播放所述缓冲区内的分段音频信息，包括：

22、根据多个所述缓冲区的播放顺序，播放多个所述缓冲区内的所述分段音频信息。

23、本发明实施方式的一种语音交互方法，用于语音交互系统，所述语音交互系统包括客户端和服务器，所述语音交互方法包括：

24、所述服务器根据预设标准将整段文本信息分段，获取若干分段文本信息和顺序信息，所述顺序信息表示若干所述分段文本信息的顺序关系；

25、所述服务器根据所述顺序信息，将所述分段文本信息加入多个合成任务，合成对应的分段音频信息并创建音频播放链接；

26、所述服务器根据所述顺序信息，将所述分段音频信息注入缓存区；

27、所述客户端根据音频播放链接，下载分段音频信息，其中，所述音频播放链接是由服务器确定的，所述分段音频信息是由所述服务器合成的；

28、所述客户端将下载的所述分段音频信息存入缓冲区；

29、所述客户端播放所述缓冲区内的分段音频信息。

30、本发明实施方式的一种服务器，包括一个或多个处理器和存储器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行的情况下，实现上述任一实施方式所述的语音合成方法的步骤。

31、本发明实施方式的一种客户端，包括一个或多个处理器和存储器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行的情况下，实现上述任一实施方式所述的语音播放方法的步骤。

32、本发明实施方式的一种语音交互系统，包括服务器和客户端，所述服务器用于根据预设标准将整段文本信息分段，获取若干分段文本信息和顺序信息，所述顺序信息表示若干所述分段文本信息的顺序关系；根据所述顺序信息，将所述分段文本信息加入多个合成任务，合成对应的分段音频信息并创建音频播放链接；根据所述顺序信息，将所述分段音频信息注入缓存区；

33、所述客户端用于根据音频播放链接，下载分段音频信息；将下载的所述分段音频信息存入缓冲区；播放所述缓冲区内的分段音频信息。

34、上述语音合成方法和服务器，能够将整段文本信息分段，通过多个合成任务分别合成与若干分段文本信息对应的分段音频信息，达到快速合成音频，加快合成效率的效果。

35、上述语音播放方法和客户端，能够下载分段音频信息并播报分段音频信息，无需下载整段音频后再进行播报，提升语音交互的时效，提升用户使用体验。

36、上述语音交互方法和语音交互系统，服务器能够将整段文本信息分段，分别合成与若干分段文本信息对应的分段音频信息，快速合成音频，还能够快速地将分段音频信息发送至客户端，无需等待所有文本信息皆合成为音频，此外，客户端播放下载的分段音频信息，能够提升语音交互时效，有效提升用户使用体验。

37、本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

技术特征：

1.一种语音合成方法，用于服务器，其特征在于，所述语音合成方法包括：

2.根据权利要求1所述的语音合成方法，其特征在于，根据所述顺序信息，将所述分段文本信息加入多个合成任务，合成对应的分段音频信息，包括：

3.根据权利要求2所述的语音合成方法，其特征在于，所述语音合成方法还包括：

4.根据权利要求3所述的语音合成方法，其特征在于，所述语音合成方法还包括：

5.一种语音播放方法，用于客户端，其特征在于，所述语音播放方法包括：

6.根据权利要求5所述的语音播放方法，其特征在于，所述根据所述音频播放链接，下载所述分段音频信息，还包括：

7.根据权利要求5所述的语音播放方法，其特征在于，所述客户端包括多个所述缓冲区，多个所述缓冲区具有播放顺序，

8.一种语音交互方法，用于语音交互系统，其特征在于，所述语音交互系统包括客户端和服务器，所述语音交互方法包括：

9.一种服务器，其特征在于，包括一个或多个处理器和存储器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行的情况下，实现权利要求1-4任一项所述的语音合成方法的步骤。

10.一种客户端，其特征在于，包括一个或多个处理器和存储器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行的情况下，实现权利要求5至7任一项所述的语音播放方法的步骤。

11.一种语音交互系统，其特征在于，包括服务器和客户端，

技术总结本发明公开一种方法、服务器、客户端和交互系统。方法包括：根据预设标准将整段文本信息分段，获取若干分段文本信息和顺序信息，顺序信息表示若干分段文本信息的顺序关系；根据顺序信息，将分段文本信息加入多个合成任务，合成对应的分段音频信息；根据顺序信息，将分段音频信息注入缓存区。上述方法，能够将整段文本信息分段，通过多个合成任务分别合成与若干分段文本信息对应的分段音频信息，达到快速合成音频，加快合成效率的效果。技术研发人员：熊进辉受保护的技术使用者：美的集团股份有限公司技术研发日：技术公布日：2024/1/15