技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种智能语音连续对话的延时保持方法及装置与流程 > 正文

一种智能语音连续对话的延时保持方法及装置与流程

国知局
2024-06-21 11:45:23

本申请涉及智能语音，尤其涉及一种智能语音连续对话的延时保持方法及装置。

背景技术：

1、在智能语音与用户的实际交互中，智能语音需要用户通过特定唤醒词唤醒，唤醒的智能语音在一段时间内未收到用户指令时，智能语音将再次进入休眠状态。如果用户的思路不够连贯，导致多次连续的语音指令之间存在时间间隔，智能语音在一次语音指令执行后等不到下一条语音指令进入休眠状态，用户的下一条语音指令在下发时智能语音已处于休眠状态，用户只能再次使用唤醒词唤醒智能语音然后下发新的语音指令，这种情况下需要用户多次重复唤醒智能语音。

2、为了避免上述情况，智能语音通常会设置一段固定的语音等待延时，例如10s，这10s内智能语音处于已唤醒状态，用户下发新的语音指令时不需要再次唤醒智能语音。

3、然而固定的语音等待延时内，乘客的语音很可能被误判为对智能语音的指令，从而产生误触发。另外，当乘客想要通过按键、结束语等方式结束当前语音对话时，固定的语音等待延时会造成乘客对系统卡顿的误解，进而影响用户使用体验。

4、因此，如何提供一种解决上述技术问题的方案是目前本领域技术人员需要解决的问题。

技术实现思路

1、有鉴于此，本申请实施例提供了一种智能语音连续对话的延时保持方法及装置，以解决现有技术中固定的语音等待延时的体验较差的问题。

2、本申请实施例的第一方面，提供了一种智能语音连续对话的延时保持方法，包括：

3、监测乘客的语音信息中是否存在语音指令；

4、若是，根据语音信息的语言特征或声学特征中的至少一种，预测当前语音指令的指令结束概率；

5、根据指令结束概率，确定对应的延时时间段；延时时间段与指令结束概率负相关；

6、在延时时间段内继续监测语音信息；

7、若监测到新的语音指令，则返回执行根据语音信息的语言特征或声学特征中的至少一种，预测当前语音指令的指令结束概率的动作；

8、若始终未监测到新的语音指令，则在延时时间段结束后停止对语音信息的监测。

9、本申请实施例的第二方面，提供了一种智能语音连续对话的延时保持装置，包括：

10、监测模块，用于监测乘客的语音信息中是否存在语音指令，若是，则触发概率确定模块；

11、概率确定模块，用于根据语音信息的语言特征或声学特征中的至少一种，预测当前语音指令的指令结束概率；

12、延时确定模块，用于根据指令结束概率，确定对应的延时时间段；延时时间段与指令结束概率负相关；

13、监测模块，还用于在延时时间段内继续监测语音信息，若监测到新的语音指令，则触发概率确定模块，若始终未监测到新的语音指令，则在延时时间段结束后停止对语音信息的监测。

14、本申请实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

15、本申请实施例的第四方面，提供了一种可读存储介质，该可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

16、本申请实施例与现有技术相比存在的有益效果至少包括：本申请实施例通过在语音信息中存在语音指令时分析当前语音信息的语言特征或升学特征中的至少一种，从而预测该语音指令的指令结束概率，并确定对应的延时时间段，如果延时时间段内出现语音指令则重新确定延时时间段，如果没有出现语音指令则在延时时间段结束后停止对语音信息的检测。由于延时时间段根据具体的语音指令的指令结束概率确定，不同于固定的延时等待时间，更为准确地预测是否结束对话，并更快速地结束对话，从而消除用户的系统卡顿误解，提高用户使用体验，避免发生误触。

技术特征：

1.一种智能语音连续对话的延时保持方法，其特征在于，包括：

2.根据权利要求1所述的延时保持方法，其特征在于，根据所述语音信息的语言特征或声学特征中的至少一种，预测当前所述语音指令的指令结束概率的过程，包括：

3.根据权利要求2所述的延时保持方法，其特征在于，

4.根据权利要求3所述的延时保持方法，其特征在于，所述声学特征包括实时语速、实时短时平均能量、实时短时平均过零率中的一种或多种；所述预设结束声学特征包括：预设语速、预设短时平均能量、预设短时平均过零率中的一种或多种；

5.根据权利要求1所述的延时保持方法，其特征在于，监测乘客的语音信息中是否存在语音指令之后，还包括：

6.根据权利要求1所述的延时保持方法，其特征在于，监测乘客的语音信息中是否存在语音指令的过程，包括：

7.根据权利要求1至6任一项所述的延时保持方法，其特征在于，根据所述指令结束概率，确定对应的延时时间段之后，还包括：

8.一种智能语音连续对话的延时保持装置，其特征在于，包括：

9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。

10.一种可读存储介质，所述可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。

技术总结本申请涉及智能语音技术领域，提供了一种智能语音连续对话的延时保持方法及装置。该方法包括：监测乘客的语音信息中是否存在语音指令；若是，根据语音信息的语言特征或声学特征中的至少一种，预测当前语音指令的指令结束概率；根据指令结束概率，确定对应的延时时间段；延时时间段与指令结束概率负相关；在延时时间段内继续监测语音信息；若监测到新的语音指令，则返回执行预测当前语音指令的指令结束概率的动作；若始终未监测到新的语音指令，则在延时时间段结束后停止对语音信息的监测。本申请中延时时间段根据具体的语音指令的指令结束概率确定，更为准确地预测是否结束对话，并更快速地结束对话，从而提高用户使用体验，避免发生误触。技术研发人员：徐焱均,赵思雨,唐如意,包楠受保护的技术使用者：重庆赛力斯新能源汽车设计院有限公司技术研发日：技术公布日：2024/4/22