技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互系统、移动终端和服务器的制作方法 > 正文

语音交互系统、移动终端和服务器的制作方法

国知局
2024-06-21 11:46:19

本技术涉及语音识别，更具体而言，涉及一种语音交互系统移动终端和服务器。

背景技术：

1、目前，在车辆的语音数据处理系统中，一般先通过语音识别技术对获取的语音命令进行识别，再通过自然语言理解对识别的结果进行语义理解的计算，最后根据语义理解的结果，映射为具体的操作，例如，根据“打开天窗”的语音命令先通过语音识别技术进行语音识别，再通过自然语言理解模型进行计算以获取语义理解的结果，最后再映射为“打开天窗”的指令，由于需要等待识别和计算的时间，导致车辆在语音交互时响应速度慢。

技术实现思路

1、本技术实施方式提供一种语音交互系统、移动终端和服务器。通过移动终端接收语音请求并将语音请求发送到服务器，服务器对接收的语音请求进行逐帧识别，获取对应的第一预测请求并生成对应的第一预测结果，再获取识别时间晚于第一预测请求的第二预测请求，生成第二预测结果，在第二预测结果的确定信息确定第一预测请求的情况下执行第一预测请求，不正确则执行确定信息包括的请求，使得可以在对语音进行识别的情况下，执行对应的操作，从而提高车辆的语音交互效率，提高用户的使用体验。

2、本技术的语音交互系统，包括：移动终端，所述移动终端用于接收语音请求并将所述语音请求发送到服务器；服务器，所述服务器用于：对接收的所述语音请求进行逐帧识别；根据所接收的语音请求获取第一预测请求，所述第一预测请求为非完整语音请求；根据所述第一预测请求生成相应的第一预测结果信息；根据所述第一预测结果信息获取相应的第一管道数据；根据所接收的语音请求获取第二预测请求，所述第二预测请求的识别时间晚于所述第一预测请求，且所述第二预测请求为非完整语音请求；根据所述第二预测请求生成相应的第二预测结果信息，所述第二预测结果信息包括断句标识，且所述第二预测结果信息包括确定信息和非确定信息；根据所述确定信息判断所述第一预测请求是否准确；若准确，则发送所述第一管道数据至所述移动终端，所述移动终端通过相应的执行单元，以执行相应的动作；若不准确，则根据所述第二预测结果信息获取对应的第二管道数据，并将所述第二预测结果信息中的确定信息对应的第二管道数据发送至所述移动终端，所述移动终端通过相应的执行单元，以执行相应的动作。

3、在某些实施方式中，还包括：若所述服务器根据所接收的语音请求获取到完整语音请求，则根据所述完整语音请求判断目标预测结果信息是否准确，所述目标预测结果信息包括所述第一预测请求和所述第二预测请求所对应的管道数据中，未发送至所述移动终端的至少一个预测结果信息；若所述目标预测结果信息准确，则发送所述未发送至所述移动终端的至少一个预测结果信息对应的管道数据至所述移动终端，所述移动终端通过相应的执行单元，以执行相应的动作；若各个所述目标预测结果信息均不准确，则根据所述完整语音请求获取对应的完整确定信息；根据所述完整确定信息获取对应的第三管道数据，并发送至所述移动终端，所述移动终端通过相应的执行单元，以执行相应的动作，所述第三管道数据不包括已发送至所述移动终端的管道数据。

4、在某些实施方式中，所述服务器还用于根据识别到的第二预测结果信息中的确定信息，将第二预测请求的字符串和第一预测请求的字符串进行比较，以确定所述第一预测请求是否准确。

5、本技术的移动终端，所述移动终端用于：接收语音请求并发送到服务器；接收所述服务器发送的管道数据，以执行相应的动作；在执行完每个相应的动作的情况下，通过语音播报动作执行结果，或者在显示屏显示动作的执行结果。

6、在某些实施方式中，所述移动终端包括机器人、车辆和手机中至少一者。

7、本技术的服务器，用于：对接收的语音请求进行逐帧识别；根据所接收的语音请求获取第一预测请求，所述第一预测请求为非完整语音请求；根据所述第一预测请求生成相应的第一预测结果信息；根据所述第一预测结果信息获取相应的第一管道数据；根据所接收的语音请求获取第二预测请求，所述第二预测请求的识别时间晚于所述第一预测请求，且所述第二预测请求为非完整语音请求；根据所述第二预测请求生成相应的第二预测结果信息，所述第二预测结果信息包括断句标识，且所述第二预测结果信息包括确定信息和非确定信息；根据所述确定信息判断所述第一预测请求是否准确；若准确，则发送所述第一管道数据至移动终端；若不准确，则根据所述第二预测结果信息获取对应的第二管道数据，并将所述第二预测结果信息中的确定信息对应的第二管道数据发送至所述移动终端。

8、在某些实施方式中，还包括：若所述服务器根据所接收的语音请求获取到完整语音请求，则根据所述完整语音请求判断目标预测结果信息是否准确，所述目标预测结果信息包括所述第一预测请求和所述第二预测请求所对应的管道数据中，未发送至所述移动终端的至少一个预测结果信息；若所述目标预测结果信息准确，则发送所述未发送至所述移动终端的至少一个预测结果信息对应的管道数据至所述移动终端；若各个所述目标预测结果信息均不准确，则根据所述完整语音请求获取对应的完整确定信息；根据所述完整确定信息获取对应的第三管道数据，并发送至所述移动终端，所述第三管道数据不包括已发送至所述移动终端的管道数据。

9、在某些实施方式中，所述服务器还用于根据识别到的第二预测结果信息中的确定信息，将第二预测请求的字符串和第一预测请求的字符串进行比较，以确定所述第一预测请求是否准确。

10、在某些实施方式中，所述服务器还用于根据所述非确定信息获取相应的第二管道数据。

11、在某些实施方式中，所述第一预测请求和所述第二预测请求基于语音识别技术对所接收的语音请求进行预测生成；所述第一预测结果信息和所述第二预测结果信息通过自然语言理解模型对对应的预测请求进行处理生成。

12、本技术实施方式的语音交互系统、移动终端和服务器，通过车辆接收语音请求并发送到服务器，服务器对接收的语音请求进行逐帧识别，使得可以更好地捕捉语音请求信号中的细节和变化，从而提高识别精度；服务器再根据所接收的语音请求获取第一预测请求，其中，第一预测请求为非完整语音请求，使得车辆能够根据接收的语音请求实时获取第一预测请求，以便后续能够提供更快的响应速度，减少用户等待时间，提高效率和用户使用体验；服务器再根据第一预测请求生成相应的第一预测结果信息，以提高对语音请求的识别和理解的准确性等，使得车辆能更好理解用户的意图和需求，并根据第一结果信息获取相应的第一管道数据；服务器再根据所接收的语音请求获取第二预测请求，第二预测请求的识别时间晚于第一预测请求，生成第二预测请求相应的第二预测结果信息，第二预测结果信息包括确定与语音请求包括的意图相同的确定信息和未确定的非确定信息，并根据确定信息判断第一预测请求是否准确，准确则发送第一管道数据至车辆，车辆接收服务器发送的管道数据以执行相应动作，不准确则将确定信息对应的第二管道数据发送至车辆，车辆接收服务器发送的管道数据以执行相应动作，从而使得车辆在接收到用户发出的语音请求时，根据语音请求进行识别和预测，并获取对应的请求的管道数据后，对确定的语音请求能迅速地做出对应的反应，执行对应的操作，从而提高用户的使用体验。

13、与目前车辆在识别结束后再调用相应的管道数据相比，本技术在识别过程中，对确定符合用户意图的确定信息，立即执行相对应的命令，减少用户在语音交互过程中等待的时间，提高用户体验。

14、本技术的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实施方式的实践了解到。