技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种服务器、终端设备及语音交互方法与流程 > 正文

一种服务器、终端设备及语音交互方法与流程

国知局
2024-06-21 11:55:43

本申请涉及语音交互，尤其涉及一种服务器、终端设备及语音交互方法。

背景技术：

1、随着科技的进步，智能语音产品受到越来越多的关注。用户可以通过语音搜索想看的电视、电影，搜索歌曲，查询天气、股票、新闻，查机票、景点、酒店等很多信息。但由于不熟悉语音业务范围及使用话术，用户在使用语音设备时，无法通过语音交互方式准确命中自己希望搜索的内容。从而导致很多用户习惯性的用固定的语音话术触达某些熟知业务，甚至放弃语音功能的使用，导致无法完全发挥语音的强大功能。这种方式会导致触达的业务使用量越来越大，未触达的业务数据量越来越小，从而限制了语音功能的推广。针对此问题，当前给出的解决方案大都是在终端随机给出当前业务类型内引导说法或以专区的方式集中展示语音功能。此类给出方式比较生硬，较少与用户的场景信息相关联，而且给出的引导说法更是与当前用户输入的说法毫无相关性，导致不能以最高效的方式发挥引导语的业务引导和推广作用。

技术实现思路

1、本申请一些实施例提供了一种服务器、终端设备及语音交互方法，通过获取语音业务的关联意图并根据关联意图确定引导语文本，播报给用户，以帮助用户以一种自然的方式准确掌握语音话术，提升用户语音触达的准确率。

2、第一方面，本申请一些实施例中提供一种服务器，被配置为：

3、接收终端设备发送的用户输入的语音数据；

4、识别所述语音数据，以确定语音业务；

5、调用语音业务对应的服务确定所述语音数据对应的回复文本，以及如果存在与所述语音业务关联的关联意图，基于所述关联意图确定引导语文本，所述引导语文本用于引导用户使用与所述语音数据相关的语句；

6、基于所述回复文本和所述引导语文本生成播报文本；

7、基于所述播报文本合成播报语音；

8、将所述播报语音发送至所述终端设备，以使所述终端设备播放所述播报语音。

9、在一些实施例中，所述服务器执行如果存在与所述语音业务关联的关联意图，基于所述关联意图确定引导语文本，被进一步配置为：

10、如果实体关联图谱中存在与所述语音业务关联的时序关联意图，基于所述实体关联意图确定引导语文本。

11、在一些实施例中，所述服务器，被配置为：

12、如果实体关联图谱中不存在与所述语音业务关联的时序关联意图，判断时序关联图谱中是否存在与所述语音业务关联的时序关联意图，所述时序关联图谱用于表征业务或意图时序之间的关联关系；

13、如果时序关联图谱中存在与所述语音业务关联的时序关联意图，判断所述时序关联意图的语音触发频率/次数是否低于第一预设阈值；

14、如果所述时序关联意图的语音触发频率/次数低于第一预设阈值，基于所述时序关联意图确定引导语文本。

15、在一些实施例中，所述服务器，被配置为：

16、如果时序关联图谱中不存在与所述语音业务关联的时序关联意图，判断场景关联图谱中是否存在与所述语音业务关联的场景关联意图，所述场景关联图谱用于表征业务使用场景之间的关联关系；

17、如果场景关联图谱中存在与所述语音业务关联的场景关联意图，判断所述场景关联意图的语音触发频率/次数是否低于第一预设阈值；

18、如果所述场景关联意图的语音触发频率/次数低于第一预设阈值，基于所述场景关联意图确定引导语文本。

19、在一些实施例中，所述服务器，被配置为：

20、如果场景关联图谱中不存在与所述语音业务关联的场景关联意图，基于所述语音业务确定引导语文本。

21、在一些实施例中，所述服务器执行基于所述关联意图确定引导语文本，被进一步配置为：

22、判断所述关联意图中是否存在组合槽位；

23、如果所述关联意图中存在组合槽位，则判断所述组合槽位的语音触发频率/次数是否低于第二预设阈值；

24、如果所述组合槽位的语音触发频率/次数低于第二预设阈值，则基于所述组合槽位对应的信息确定引导语文本。

25、在一些实施例中，所述服务器，被配置为：

26、如果所述关联意图中不存在组合槽位，或者，如果所述组合槽位的语音触发频率/次数不低于第二预设阈值，判断单一槽位的语音触发频率/次数是否低于第二预设阈值；

27、如果所述单一槽位的语音触发频率/次数低于第二预设阈值，则基于所述单一槽位对应的信息确定引导语文本。

28、第二方面，本申请一些实施例中提供一种终端设备，包括：

29、声音采集器，被配置为采集用户输入的语音数据；

30、通信器，被配置为与服务器进行数据通信；

31、音频输出接口，被配置为播放语音；

32、控制器，被配置为：

33、获取用户输入的语音数据；

34、将所述语音数据发送至服务器；

35、接收所述服务器基于所述语音数据生成的播报语音；

36、控制所述音频输出接口播放所述播报语音。

37、第三方面，本申请一些实施例中提供一种语音交互方法，应用于服务器，包括：

38、接收终端设备发送的用户输入的语音数据；

39、识别所述语音数据，以确定语音业务；

40、调用语音业务对应的服务确定所述语音数据对应的回复文本，以及如果存在与所述语音业务关联的关联意图，基于所述关联意图确定引导语文本，所述引导语文本用于引导用户使用与所述语音数据相关的语句；

41、基于所述回复文本和所述引导语文本生成播报文本；

42、基于所述播报文本合成播报语音；

43、将所述播报语音发送至所述终端设备，以使所述终端设备播放所述播报语音。

44、第四方面，本申请一些实施例中提供一种语音交互方法，应用于终端设备，包括：

45、获取用户输入的语音数据；

46、将所述语音数据发送至服务器；

47、接收所述服务器基于所述语音数据生成的播报语音；

48、控制音频输出接口播放所述播报语音。

49、本申请的一些实施例提供一种服务器、终端设备及语音交互方法。终端设备在接收到用户输入的语音数据后，将语音数据发送至服务器。服务器识别所述语音数据，以确定语音业务；调用语音业务对应的服务确定所述语音数据对应的回复文本，以及如果存在与所述语音业务关联的关联意图，基于所述关联意图确定引导语文本。其中，引导语文本用于引导用户使用与所述语音数据相关的语句；对所述回复文本和所述引导语文本进行组合拼接，得到播报文本；基于所述播报文本合成播报语音；将所述播报语音发送至所述终端设备，以使所述终端设备播放所述播报语音。本申请实施例通过获取语音业务的关联意图并根据关联意图确定引导语文本，播报给用户，以帮助用户以一种自然的方式准确掌握语音话术，提升用户语音触达的准确率。

技术特征：

1.一种服务器，其特征在于，被配置为：

2.根据权利要求1所述的服务器，其特征在于，所述服务器执行如果存在与所述语音业务关联的关联意图，基于所述关联意图确定引导语文本，被进一步配置为：

3.根据权利要求2所述的服务器，其特征在于，所述服务器，被配置为：

4.根据权利要求3所述的服务器，其特征在于，所述服务器，被配置为：

5.根据权利要求4所述的服务器，其特征在于，所述服务器，被配置为：

6.根据权利要求1所述的服务器，其特征在于，所述服务器执行基于所述关联意图确定引导语文本，被进一步配置为：

7.根据权利要求6所述的服务器，其特征在于，所述服务器，被配置为：

8.一种终端设备，其特征在于，包括：

9.一种语音交互方法，应用于服务器，其特征在于，包括：

10.一种语音交互方法，应用于终端设备，其特征在于，包括：

技术总结本申请一些实施例示出一种服务器、终端设备及语音交互方法，所述方法包括：接收终端设备发送的用户输入的语音数据；识别所述语音数据，以确定语音业务；调用语音业务对应的服务确定所述语音数据对应的回复文本，以及如果存在与所述语音业务关联的关联意图，基于所述关联意图确定引导语文本；基于所述回复文本和所述引导语文本生成播报文本；基于所述播报文本合成播报语音；将所述播报语音发送至所述终端设备，以使所述终端设备播放所述播报语音。本申请实施例通过获取语音业务的关联意图并根据关联意图确定引导语文本，播报给用户，以帮助用户以一种自然的方式准确掌握语音话术，提升用户语音触达的准确率。技术研发人员：张路伟受保护的技术使用者：海信视像科技股份有限公司技术研发日：技术公布日：2024/6/2