技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音数据处理系统、移动终端和服务器的制作方法 > 正文

语音数据处理系统、移动终端和服务器的制作方法

国知局
2024-06-21 11:46:16

本申请涉及语音识别，更具体而言，涉及一种语音数据处理系统、移动终端和服务器。

背景技术：

1、目前，在车辆的语音数据处理系统中，一般先通过语音识别技术对获取的语音命令进行识别，再通过自然语言理解对识别的结果进行语义理解的计算，最后根据语义理解的结果，映射为具体的操作，例如，根据“打开天窗”的语音命令先通过语音识别技术进行语音识别，再通过自然语言理解模型进行计算以获取语义理解的结果，最后再映射为“打开天窗”的指令，由于需要等待识别和计算的时间，导致车辆在语音交互时响应速度慢。

技术实现思路

1、本申请实施方式提供一种语音数据处理系统、移动终端和服务器。移动终端用于接收语音请求并发送到服务器，服务器用于对接收的语音请求进行逐帧识别，并获取第一预测请求和第一预测结果信息，存储和确定信息对应的管道数据，使得车辆可以根据存储的管道数据执行对应操作，提高车辆语音交互的响应速度。

2、本申请的一种语音数据处理系统，包括：移动终端，所述移动终端用于接收语音请求并将所述语音请求发送到服务器；服务器，所述服务器用于：对接收的所述语音请求进行逐帧识别；根据所接收的当前帧语音请求获取第一预测请求，所述第一预测请求为非完整语音请求；根据所述第一预测请求生成相应的第一预测结果信息，所述第一预测结果信息包括非确定信息；根据当前帧之后所接收的语音请求获取第二预测请求，所述第二预测请求为非完整语音请求；根据所述第二预测请求生成相应的第二预测结果信息，所述第二预测结果信息包括确定信息和非确定信息；根据所述第二预测结果信息的确定信息判断所述第一预测请求是否准确；若是，则根据所述第一预测结果获取对应的第一管道数据并存储；若否，则根据所述第二预测结果信息的确定信息获取对应的第二管道数据并存储。

3、在某些实施方式中，还包括：若所述服务器根据所接收的语音请求获取到完整语音请求，则将所述第一管道数据或所述第二管道数据发送至所述移动终端，所述移动终端通过相应的执行单元，以执行对应的动作。

4、在某些实施方式中，还包括：若所述服务器根据所接收的语音请求获取到完整语音请求，则根据所述完整语音请求与全部预测请求比对，并判断全部预测请求中是否有与完整语音请求完全相同的目标预测请求；若是，则调取所述目标预测请求对应的目标预测结果信息，并根据所述目标预测结果信息获取目标管道数据；若否，则根据所述完整语音请求生成相应的目标预测结果信息，并根据所述目标预测结果信息获取目标管道数据；将所述目标管道数据发送至所述移动终端，所述移动终端通过相应的执行单元，以执行相应的动作，所述目标管道数据不包括所述第一管道数据或所述第二管道数据。

5、本申请的移动终端，用于：接收语音请求并发送到服务器；接收所述服务器发送的管道数据，以执行相应的动作；在执行完每个相应的动作的情况下，通过语音播报动作执行结果，或者在显示屏显示动作的执行结果。

6、在某些实施方式中，所述移动终端包括机器人、车辆和手机中至少一者。

7、本申请的服务器，用于：接收移动终端传输的语音请求并对所述语音请求进行逐帧识别；根据所接收的当前帧语音请求获取第一预测请求，所述第一预测请求为非完整语音请求；根据所述第一预测请求生成相应的第一预测结果信息，所述第一预测结果信息包括非确定信息；根据当前帧之后所接收的语音请求获取第二预测请求，所述第二预测请求为非完整语音请求；根据所述第二预测请求生成相应的第二预测结果信息，所述第二预测结果信息包括确定信息和非确定信息；根据所述第二预测结果信息的确定信息判断所述第一预测请求是否准确；若是，则根据所述第一预测结果获取对应的第一管道数据并存储；若否，则根据所述第二预测结果信息的确定信息获取对应的第二管道数据并存储。

8、在某些实施方式中，还用于：在存储所述第一管道数据或所述第二管道数据之后，根据所接收的语音请求获取第三预测请求，所述第三预测请求为非完整语音请求；根据所述第三预测请求获取对应的生成相应的第三预测结果信息并存储。

9、在某些实施方式中，还用于：若根据所接收的语音请求获取到完整语音请求，则将所述第一管道数据或所述第二管道数据发送至所述移动终端。

10、在某些实施方式中，还用于：若根据所接收的语音请求获取到完整语音请求，则根据所述完整语音请求与全部预测请求比对，并判断全部预测请求中是否有与完整语音请求完全相同的目标预测请求；若是，则调取所述目标预测请求对应的目标预测结果信息，并根据所述目标预测结果信息获取目标管道数据；若否，则根据所述完整语音请求生成相应的目标预测结果信息，并根据所述目标预测结果信息获取目标管道数据；将所述目标管道数据发送至所述移动终端，所述目标管道数据不包括所述第一管道数据或所述第二管道数据。

11、在某些实施方式中，所述第一预测请求和所述第二预测请求基于语音识别技术对所接收的语音请求进行预测生成；所述第一预测结果信息和所述第二预测结果信息通过自然语言理解模型对对应的预测请求进行处理生成。

12、本申请实施方式的语音数据处理系统、移动终端和服务器，通过将移动终端用于接收语音请求并发送到服务器，服务器用于对所接收的语音请求进行逐帧识别，使得可以更好地捕捉语音请求信号中的细节和变化，从而提高识别精度；再将服务器用于根据所接收的当前帧语音请求获取第一预测请求，其中，第一预测请求为非完整语音请求，使得后续能够提供更快的响应速度，减少用户等待时间，提高效率和用户使用体验；再将服务器用于根据第一预测请求生成相应的第一预测结果信息，其中，第一预测结果信息包括非确定信息，提高预测和识别的准确性；将服务器用于根据当前帧之后所接收的语音请求获取第二预测请求，其中，第二预测请求为非完整语音请求，以尽可能准确地反映用户的意图，和保持第二预测请求与第一预测请求之间的一致性和连贯性；将服务器用于根据第二预测请求生成相应的第二预测结果信息，第二预测结果信息包括确定信息和非确定信息，进一步提高预测和识别的准确性；将服务器用于根据第二预测结果信息的确定信息判断第一预测请求是否准确，若准确，则根据第一预测结果获取对应的第一管道数据并存储，若不准确，则根据第二预测结果信息的确定信息获取对应的第二管道数据并存储，使得存储的都是确定信息对应的管道数据，在后续执行指令的时候，能够迅速调用存储的管道数据、或者根据存储的管道数据做出响应，保证执行的动作的准确性，提高用户体验；并且，不需要再等待确定信息对应的请求的asr的语音识别时间、nlu的计算时间等，可以通过调用存储的管道数据，节省等待时间，从而提高语音交互体验。

13、本申请的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实施方式的实践了解到。

技术特征：

1.一种语音数据处理系统，其特征在于，包括：

2.根据权利要求1所述的语音数据处理系统，其特征在于，还包括：

3.根据权利要求2所述的语音数据处理系统，其特征在于，还包括：

4.一种移动终端，其特征在于，所述移动终端用于：

5.根据权利要求4所述的移动终端，其特征在于，所述移动终端包括机器人、车辆和手机中至少一者。

6.一种服务器，其特征在于，用于：

7.根据权利要求6所述的服务器，其特征在于，还用于：

8.根据权利要求6所述的服务器，其特征在于，还用于：

9.根据权利要求8所述的服务器，其特征在于，还用于：

10.根据权利要求6所述的服务器，其特征在于，所述第一预测请求和所述第二预测请求基于语音识别技术对所接收的语音请求进行预测生成；所述第一预测结果信息和所述第二预测结果信息通过自然语言理解模型对对应的预测请求进行处理生成。

技术总结本申请公开一种语音数据处理系统、移动终端和服务器。语音数据处理系统包括用于接收语音请求并发送到服务器的移动终端和用于对接收的语音请求进行逐帧识别的服务器；服务器用于根据所接收的当前帧语音请求获取第一预测请求，第一预测请求为非完整语音请求；根据第一预测请求生成第一预测结果信息，第一预测结果信息包括非确定信息；根据当前帧之后所接收的语音请求获取第二预测请求和相应的第二预测结果信息，第二预测结果信息包括确定信息和非确定信息；根据第二预测结果信息的确定信息判断第一预测请求是否准确；是则根据第一预测结果获取对应的第一管道数据并存储；否则根据确定信息获取对应的第二管道数据并存储，提高语音交互速度。技术研发人员：刘玉颉,张岩,郭雅林受保护的技术使用者：广州小鹏汽车科技有限公司技术研发日：技术公布日：2024/4/24