技术新讯 > 乐器声学设备的制造及制作,分析技术 > 多屏车辆的语音控制方法、设备及存储介质与流程 > 正文

多屏车辆的语音控制方法、设备及存储介质与流程

国知局
2024-06-21 11:40:51

本技术涉及车辆，尤其涉及一种多屏车辆的语音控制方法、设备及存储介质。

背景技术：

1、随着智能座舱的不断发展，安装在车辆中的屏幕也越来越多，例如，可以在车辆中安装中控屏、副驾屏、后排屏等，为便于进行车辆中各屏幕的控制，目前通常采用语音系统来进行各屏幕的控制。

2、但是，中控屏和副驾屏可能会存在控制冲突，例如，在中控屏和副驾屏同时被启用且所显示的内容相同的情形下，假设用户想通过语音系统控制中控屏触发视频软件a的启用键，以控制中控屏进入到视频软件a的主显示界面，而由于中控屏和副驾屏所显示的内容相同，也即中控屏和副驾屏都显示有视频软件a，因而中控屏和副驾屏都具备视频软件a的启用键，此时如果用户下达的语音指令仅指示了需要打开视频软件a，而未具体指示需要打开的是中控屏的视频软件a还是副驾屏的视频软件a，就会导致语音系统无法准确识别用户想控制的是中控屏还是副驾屏。

3、综上可知，目前对于多屏车辆的语音控制方式可能会违背用户的操作意愿，从而影响用户的使用体验。因此，如何提高多屏车辆的语音控制的准确性，以提高用户的使用体验，是目前亟需解决的一个问题。

技术实现思路

1、本技术的主要目的在于提供一种多屏车辆的语音控制方法、装置、设备及存储介质，旨在解决如何提高多屏车辆的语音控制的准确性，以提高用户的使用体验的技术问题。

2、为实现上述目的，本技术提供一种多屏车辆的语音控制方法，所述多屏车辆的主驾驶区域和副驾驶区域均设置有头部朝向检测装置，所述多屏车辆的语音控制方法包括：

3、在检测到所述多屏车辆所接收的车内语音信号携带了意图信息的情形下，确定所述车内语音信号的声源位置；

4、若所述声源位置在目标区域内，则通过所述目标区域对应的头部朝向检测装置采集目标用户的头部朝向信息，其中，所述目标区域为所述主驾驶区域或所述副驾驶区域，所述目标用户是指处在所述目标区域的用户；

5、在所述多屏车辆的中控屏和副驾屏中，将所述头部朝向信息所指向的屏幕确定为目标屏幕；

6、控制所述目标屏幕执行所述车内语音信号的指令内容。

7、可选地，所述头部朝向信息包括头部朝向角度，所述在所述多屏车辆的中控屏和副驾屏中，将所述头部朝向信息所指向的屏幕确定为目标屏幕的步骤，包括：

8、若所述头部朝向角度在所述目标区域对应的中控屏角度范围内，则将所述中控屏确定为所述目标屏幕；

9、若所述头部朝向角度在所述目标区域对应的副驾屏角度范围内，则将所述副驾屏确定为所述目标屏幕。

10、可选地，所述通过所述目标区域对应的头部朝向检测装置采集目标用户的头部朝向信息的步骤之前，所述多屏车辆的语音控制方法还包括：

11、判断所述车内语音信号携带的意图信息是否属于可见即可说意图；

12、若是，则判断所述中控屏和所述副驾屏是否均能执行所述车内语音信号的指令内容；

13、若所述中控屏和所述副驾屏均能执行所述车内语音信号的指令内容，则执行所述通过所述目标区域对应的头部朝向检测装置采集目标用户的头部朝向信息的步骤；

14、若所述中控屏能执行所述车内语音信号的指令内容，并且所述副驾屏不能执行所述车内语音信号的指令内容，则控制所述中控屏执行所述车内语音信号的指令内容；

15、若所述副驾屏能执行所述车内语音信号的指令内容，并且所述中控屏不能执行所述车内语音信号的指令内容，则控制所述副驾屏执行所述车内语音信号的指令内容。

16、可选地，所述主驾驶区域和所述副驾驶区域均设置有唇动检测装置，所述通过所述目标区域对应的头部朝向检测装置采集目标用户的头部朝向信息的步骤之前，所述多屏车辆的语音控制方法还包括：

17、通过所述目标区域对应的唇动检测装置采集所述目标用户的用户唇动信息；

18、依据所述用户唇动信息和所述车内语音信号，确定所述目标用户是否为所述车内语音信号的发起人；

19、若是，则执行所述通过所述目标区域对应的头部朝向检测装置采集目标用户的头部朝向信息的步骤。

20、可选地，所述依据所述用户唇动信息和所述车内语音信号，确定所述目标用户是否为所述车内语音信号的发起人的步骤，包括：

21、确定所述车内语音信号对应的语音唇动信息，其中，所述语音唇动信息是指说出所述车内语音信号的文本内容时的嘴唇动作所对应的唇动信息；

22、若所述用户唇动信息与所述语音唇动信息匹配，则确定所述目标用户为所述车内语音信号的发起人；

23、若所述用户唇动信息与所述语音唇动信息不匹配，则确定所述目标用户不为所述车内语音信号的发起人。

24、可选地，所述依据所述用户唇动信息和所述车内语音信号，确定所述目标用户是否为所述车内语音信号的发起人的步骤，包括：

25、获取所述车内语音信号的接收起始时间和接收结束时间，以及获取所述用户唇动信息的唇动起始时间和唇动结束时间；

26、确定所述接收起始时间与所述唇动起始时间的起始时间差，以及确定所述接收结束时间与所述唇动结束时间的结束时间差；

27、若检测到所述起始时间差在第一预设时间差范围内，并且所述结束时间差在第二预设时间差范围内，则确定所述目标用户为所述车内语音信号的发起人；

28、若检测到所述起始时间差不在所述第一预设时间差范围内，或者所述结束时间差不在所述第二预设时间差范围内，则确定所述目标用户不为所述车内语音信号的发起人。

29、可选地，所述多屏车辆的语音控制方法还包括：

30、对所述多屏车辆所接收的车内语音信号进行文本转换，得到文本信息；

31、通过文本意图分析算法，分析所述文本信息中是否存在意图信息；

32、若是，则确定所述车内语音信号携带了意图信息；

33、若否，则确定所述车内语音信号未携带意图信息。

34、可选地，所述对所述多屏车辆所接收的车内语音信号进行文本转换，得到文本信息的步骤，包括：

35、对所述多屏车辆所接收的车内语音信号进行降噪处理，得到经降噪处理后的车内语音信号；

36、对经降噪处理后的所述车内语音信号进行文本转换，得到所述文本信息。

37、本技术还提供一种多屏车辆的语音控制装置，所述多屏车辆的主驾驶区域和副驾驶区域均设置有头部朝向检测装置，所述多屏车辆的语音控制装置包括：

38、第一确定模块，用于在检测到所述多屏车辆所接收的车内语音信号携带了意图信息的情形下，确定所述车内语音信号的声源位置；

39、采集模块，用于若所述声源位置在目标区域内，则通过所述目标区域对应的头部朝向检测装置采集目标用户的头部朝向信息，其中，所述目标区域为所述主驾驶区域或所述副驾驶区域，所述目标用户是指处在所述目标区域的用户；

40、第二确定模块，用于在所述多屏车辆的中控屏和副驾屏中，将所述头部朝向信息所指向的屏幕确定为目标屏幕；

41、控制模块，用于控制所述目标屏幕执行所述车内语音信号的指令内容。

42、本技术还提供一种多屏车辆的语音控制设备，所述多屏车辆的语音控制设备为实体设备，所述多屏车辆的语音控制设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述多屏车辆的语音控制方法的步骤。

43、本技术还提供一种存储介质，所述存储介质为计算机可读存储介质，所述计算机可读存储介质上存储有实现多屏车辆的语音控制方法的程序，所述实现多屏车辆的语音控制方法的程序被处理器执行以实现如上所述多屏车辆的语音控制方法的步骤。

44、本技术还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述的多屏车辆的语音控制方法的步骤。

45、本技术提供了一种多屏车辆的语音控制方法，该多屏车辆的主驾驶区域和副驾驶区域均设置有头部朝向检测装置，本技术在检测到多屏车辆所接收的车内语音信号携带了意图信息的情形下，说明该车内语音信息存在用于控制多屏车辆的屏幕的指令内容，而为确保语音控制的准确性，需要先确定该车内语音信号的声源位置；如果该车内语音信号的声源位置在目标区域内，即该车内语音信号的声源位置在主驾驶区域或副驾驶区域内，则需要通过目标区域对应的头部朝向检测装置来采集处在该目标区域的用户的头部朝向信息，以通过该头部朝向信息来确定需要该车内语音信号控制的目标屏幕是中控屏还是副驾屏，接着再控制目标屏幕执行车内语音信号的指令内容，以避免前排区域的语音控制所存在的中控屏和副驾屏的控制冲突的问题。

46、综上，本技术通过头部朝向信息来明确车内语音信号所控制的目标屏幕是中控屏还是副驾屏，从而能够克服中控屏和副驾屏所存在的控制冲突的技术缺陷，提高了多屏车辆的语音控制的准确性，进而提高了用户的使用体验。