技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音数据处理系统、移动终端和服务器的制作方法 > 正文

语音数据处理系统、移动终端和服务器的制作方法

国知局
2024-06-21 11:42:47

本申请涉及语音识别，更具体而言，涉及一种语音数据处理系统、移动终端和服务器。

背景技术：

1、目前，在车辆的语音数据处理系统中，一般先通过语音识别技术对获取的语音命令进行识别，再通过自然语言理解对识别的结果进行语义理解的计算，最后根据语义理解的结果，映射为具体的操作，例如，根据“打开天窗”的语音命令先通过语音识别技术进行语音识别，再通过自然语言理解模型进行计算以获取语义理解的结果，最后再映射为“打开天窗”的指令，由于需要等待识别和计算的时间，导致车辆在语音交互时响应速度慢。

技术实现思路

1、本申请实施方式提供一种语音数据处理系统、移动终端和服务器。通过移动终端接收语音请求并将语音请求发送到服务器，服务器对接收的语音请求进行逐帧识别，实时获取对应的预测请求与预测结果信息，并根据预测结果信息获取并存储相应的管道数据，使得可以根据存储的管道数据执行对应操作，减少计算和等待的时间，提高车辆语音交互的响应速度。

2、本申请的语音数据处理系统，包括移动终端和服务器，所述移动终端用于接收语音请求并将所述语音请求发送到服务器；所述服务器用于：对接收的所述语音请求进行逐帧识别；根据所接收的语音请求获取预测请求，所述预测请求为非完整语音请求；根据所述预测请求生成相应的预测结果信息；根据所述预测结果信息获取相应的管道数据并存储。

3、在某些实施方式中，所述服务器还用于：若所述预测结果信息不包括断句标识，且所述预测结果信息包括非确定信息，则根据所述非确定信息获取相应的管道数据并存储；若所述预测结果信息包括断句标识，且所述预测结果信息包括确定信息和非确定信息，则根据所述预测结果信息的确定信息和非确定信息获取相应的管道数据并存储。

4、在某些实施方式中，还包括：若所述服务器根据所接收的语音请求获取到完整语音请求，则根据所述完整语音请求与全部所述预测请求比对，并判断全部预测请求中是否有与完整语音请求完全相同的目标预测请求；若全部预测请求中有与完整语音请求完全相同的目标预测请求，则调取所述目标预测请求对应的目标管道数据；将所述目标管道数据发送至所述移动终端，所述移动终端通过相应的执行单元，以执行相应的动作。

5、本申请的移动终端，用于接收语音请求并发送到服务器；接收所述服务器发送的管道数据，以执行相应的动作；在执行完每个相应的动作的情况下，通过语音播报动作执行结果，或者在显示屏显示动作的执行结果。

6、在某些实施方式中，所述移动终端包括机器人、车辆和手机中至少一者。

7、本申请的服务器，用于对接收的语音请求进行逐帧识别；根据所接收的语音请求获取预测请求，所述预测请求为非完整语音请求；根据所述预测请求生成相应的预测结果信息；根据所述预测结果信息获取相应的管道数据并存储。

8、在某些实施方式中，所述服务器还用于：若所述预测结果信息不包括断句标识，且所述预测结果信息包括非确定信息，则根据所述非确定信息获取相应的管道数据并存储；若所述预测结果信息包括断句标识，且所述预测结果信息包括确定信息和非确定信息，则根据所述预测结果信息的确定信息和非确定信息获取相应的管道数据并存储。

9、在某些实施方式中，所述服务器还用于：若根据所接收的语音请求获取到完整语音请求，则根据所述完整语音请求与全部所述预测请求比对，并判断全部预测请求中是否有与完整语音请求完全相同的目标预测请求；若全部预测请求中有与完整语音请求完全相同的目标预测请求，则调取所述目标预测请求对应的目标管道数据；将所述目标管道数据发送至移动终端。

10、在某些实施方式中，所述服务器还用于：若根据所接收的语音请求获取到完整语音请求，则根据所述完整语音请求与全部所述预测请求比对，并判断全部预测请求中是否有与完整语音请求完全相同的目标预测请求；若全部预测请求中没有与完整语音请求完全相同的目标预测请求，则根据所述完整语音请求生成相应的目标预测结果信息，并根据所述目标预测结果信息获取目标管道数据。

11、在某些实施方式中，所述服务器还用于：若全部预测请求中没有与完整语音请求完全相同的目标预测请求，则从各个所述预测结果信息中筛选出一组确定信息，调取相应的确定管道数据，并发送至所述移动终端；并根据完整语音请求中和各个所述预测结果信息不匹配的结果信息获取对应的管道数据，并发送至所述移动终端。

12、本申请实施方式的语音数据处理系统、移动终端和服务器，通过移动终端接收语音请求并发送到服务器，服务器对所接收的语音请求进行逐帧识别，使得可以更好地捕捉语音请求信号中的细节和变化，从而提高识别精度；再将服务器用于根据所接收的语音请求获取预测请求，其中，预测请求为非完整语音请求，使得能够实时获取预测请求，以便后续能够提供更快的响应速度，减少用户等待时间，提高效率和用户使用体验；再将服务器用于根据预测请求生成相应的预测结果信息，提高对语音请求的识别和理解的准确性、对预测结果的正确性等，从而能够更好地理解用户的意图和需求，由于预测结果信息包括执行操作需要的数据信息，如nlu的数据信息，减少预测结果信息的计算时间；最后，再将服务器用于根据预测结果信息获取相应的管道数据并存储，使得能够在语音请求接收完毕后，能迅速调用存储的管道数据、或根据存储的管道数据做出响应，从而提高语音交互体验，提高移动终端的语音交互的响应速度。

13、与目前的移动终端语音交互方式对比，不需要再等待asr的语音识别时间、nlu的计算时间等，可以通过调用存储的管道数据，节省等待时间，减少了在识别出各个请求后，再根据各个请求进行计算和获取所需的结果信息的计算时间，缩短等待和读取预测结果信息的时间。

14、本申请的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实施方式的实践了解到。

技术特征：

1.一种语音数据处理系统，其特征在于，包括：

2.根据权利要求1所述的语音数据处理系统，其特征在于，所述服务器还用于：

3.根据权利要求1所述的语音数据处理系统，其特征在于，还包括：

4.一种移动终端，其特征在于，所述移动终端用于：

5.根据权利要求4所述的移动终端，其特征在于，所述移动终端包括机器人、车辆和手机中至少一者。

6.一种服务器，其特征在于，用于：

7.根据权利要求6所述的服务器，其特征在于，所述服务器还用于：

8.根据权利要求6所述的服务器，其特征在于，所述服务器还用于：

9.根据权利要求8所述的服务器，其特征在于，所述服务器还用于：

10.根据权利要求8所述的服务器，其特征在于，所述服务器还用于：

技术总结本申请公开一种语音数据处理系统、移动终端和服务器。语音数据处理系统包括移动终端和服务器，移动终端用于接收语音请求并将语音请求发送到服务器，服务器用于对所接收的语音请求进行逐帧识别、根据所接收的语音请求获取预测请求，预测请求为非完整语音请求和根据预测请求生成相应的预测结果信息；根据预测结果信息获取相应的管道数据并存储。通过接收语音请求并对语音请求进行逐帧识别，提高识别精度；再根据所接收的语音请求获取预测请求，使得能够实时获取预测请求，提供更快的响应速度；再根据预测请求生成相应的预测结果信息，提高对语音请求的识别理解的准确性等；最后，根据预测结果信息获取相应的管道数据并存储。技术研发人员：刘玉颉,张岩,郭雅林受保护的技术使用者：广州小鹏汽车科技有限公司技术研发日：技术公布日：2024/4/17