技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种车载语音流式对话的控制系统及方法与流程 > 正文

一种车载语音流式对话的控制系统及方法与流程

国知局
2024-06-21 11:44:14

本发明涉及车载语音流式对话，具体涉及一种车载语音流式对话的控制系统及方法。

背景技术：

1、目前，车载语音控制技术从单意图自然语音识别到多意图自然语音识别演变，支持用户任意语音指令的车控操作以及各种语音指令组合的车控操作。市面上的车辆最多支持用户说三个指令以及跨二个功能域，跨域之间存在识别不准确以及执行无反馈等问题，且需等用户说完之后开始语音处理并下发对应的车辆控制指令，从用户说完到开始执行的等待时间根据用户下发的指令个数多少来判别，时间长短不一。

2、但是，对于语音指令操作来说，均无法达到人与机器之间下达操作命令可以边说边做的流畅体验。同时涉及到流式对话过程中产生的多轮对话必然会打断流式控制的问题。

技术实现思路

1、针对上述问题，本发明提供了一种车载语音流式对话的控制系统及方法，为保证流式的正常运行，流式指令可实现范围包括但不限于车控、导航、音乐、天气、电话等语音可控域，各域均支持业务垂类的首轮交互指令，同时对于同域指令的业务垂类数量不做限制，流式对话可以从体验上提升用户连续多个指令的响应速度，让指令边说边执行，进而实现更加流畅快速的人机对话。

2、第一方面，本发明提供一种车载语音流式对话的控制系统，包括流式语音指令模块，该流式语音指令模块包括：

3、需求技能指令判断模块，用于识别流式语音指令，并判断该流式语音指令是否是需求技能指令；

4、流式尾句指令判断模块，用于识别并判断当前需求技能指令是否是一段流式尾句指令；其中，当需求技能指令是流式尾句指令时，判断下发执行的需求技能指令是否是用户预先设定并须配合tts播报使用的车控指令；

5、tts播报模块，当识别下发执行的需求技能指令是用户预先设定并须配合tts播报使用的车控指令时，进行无收尾tts播报；当识别下发执行的需求技能指令不是用户预先设定并须配合tts播报使用的车控指令时，无tts播报。

6、在进一步的技术方案中，该流式语音指令模块还包括流式语音指令判断模块，用于判断用户输入的连续语音指令是否是流式语音指令；

7、当连续语音指令是流式语音指令时，进入需求技能指令判断模块；

8、当连续语音指令不是流式语音指令时，为常规的车控指令，按该车控指令下发。

9、在进一步的技术方案中，该流式语音指令模块还包括强依赖tts播报技能判断模块，

10、用于当需求技能指令不是流式尾句指令时，判断需求技能指令是否是现有车机系统中须要车控指令与tts播报配合使用的强依赖tts播报技能；其中，当需求技能指令是强依赖tts播报技能时，执行该需求技能指令，并进行tts播报。

11、在进一步的技术方案中，该流式语音指令模块还包括多轮交互技能判断模块，

12、用于当需求技能指令不是强依赖tts播报技能时，判断该需求技能指令是否是多轮交互对话；其中，当需求技能指令不是多轮交互对话时，执行需求技能指令，不播报tts。

13、在进一步的技术方案中，该流式语音指令模块还包括后置处理模块，

14、用于当需求技能指令是多轮交互对话时，该多轮交互对话所对应的需求技能指令会后置处理，先执行不是多轮交互对话所对应的需求技能指令。

15、第二方面，本发明提供一种车载语音流式对话的控制方法，包括以下步骤：

16、步骤1、需求技能指令判断，用于识别流式语音指令，并判断该流式语音指令是否是需求技能指令；

17、步骤2、流式尾句指令判断，用于识别并判断当前需求技能指令是否是一段流式尾句指令；其中，当需求技能指令是流式尾句指令时，判断下发执行的需求技能指令是否是用户预先设定并须配合tts播报使用的车控指令；

18、步骤3、tts播报，用于当识别下发执行的需求技能指令是用户预先设定并须配合tts播报使用的车控指令时，进行无收尾tts播报；用于当识别下发执行的需求技能指令不是用户预先设定并须配合tts播报使用的车控指令时，无tts播报。

19、在进一步的技术方案中，在步骤1之前还包括以下步骤：

20、流式语音指令判断，用于判断用户输入的连续语音指令是否是流式语音指令；

21、当连续语音指令是流式语音指令时，进入需求技能指令判断模块；

22、当连续语音指令不是流式语音指令时，为常规的车控指令，按该车控指令下发。

23、在进一步的技术方案中，还包括以下步骤：

24、步骤4、强依赖tts播报技能判断，用于当需求技能指令不是流式尾句指令时，判断需求技能指令是否是现有车机系统中须要车控指令与tts播报配合使用的强依赖tts播报技能；其中，当需求技能指令是强依赖tts播报技能时，执行该需求技能指令，并进行tts播报。

25、在进一步的技术方案中，还包括以下步骤：

26、步骤5、多轮交互技能判断，用于当需求技能指令不是强依赖tts播报技能时，判断该需求技能指令是否是多轮交互对话；其中，当需求技能指令不是多轮交互对话时，执行需求技能指令，不播报tts。

27、在进一步的技术方案中，还包括以下步骤：

28、步骤6、后置处理，用于当需求技能指令是多轮交互对话时，该多轮交互对话所对应的需求技能指令会后置处理，先执行不是多轮交互对话所对应的需求技能指令。

29、本发明提供的一种车载语音流式对话的控制系统及方法，需要现有车机系统进行配合，所述车机系统包括车机系统处理模块和界面显示模块，其中，

30、车机系统处理模块用来处理语义协议，转为车控信息后下发someip信号等车控类指令以及提供车控指令执行的反馈结果和特殊处理不需要播报部分指令的tts技能；

31、界面显示模块用以显示用户下发的语音指令，只占用一行，从下往上刷新执行指令与执行结果，结果类型呈现；成功、失败、超时，执行结果与tts播报同步。本发明让用户的语音使用体验感更加流程。

32、本发明的有益效果是：

33、1、本发明的技术方案实现了人与机器之间下达操作命令边说边做的流畅体验。

34、2、本发明的技术方案解决了流式对话过程中产生的多轮对话必然会打断流式控制的问题。

技术特征：

1.一种车载语音流式对话的控制系统，其特征在于，包括流式语音指令模块，所述流式语音指令模块包括：

2.根据权利要求1所述的一种车载语音流式对话的控制系统，其特征在于，所述流式语音指令模块还包括流式语音指令判断模块，用于判断用户输入的连续语音指令是否是流式语音指令；

3.根据权利要求1所述的一种车载语音流式对话的控制系统，其特征在于，所述流式语音指令模块还包括强依赖tts播报技能判断模块，

4.根据权利要求3所述的一种车载语音流式对话的控制系统，其特征在于，所述流式语音指令模块还包括多轮交互技能判断模块，

5.根据权利要求4所述的一种车载语音流式对话的控制系统，其特征在于，所述流式语音指令模块还包括后置处理模块，

6.一种车载语音流式对话的控制方法，其特征在于，包括以下步骤：

7.根据权利要求1所述的一种车载语音流式对话的控制方法，其特征在于，在步骤1之前还包括以下步骤：

8.根据权利要求1所述的一种车载语音流式对话的控制方法，其特征在于，还包括以下步骤：

9.根据权利要求8所述的一种车载语音流式对话的控制方法，其特征在于，还包括以下步骤：

10.根据权利要求1所述的一种车载语音流式对话的控制方法，其特征在于，还包括以下步骤：

技术总结本发明提供一种车载语音流式对话的控制系统及方法，包括流式语音指令模块，所述流式语音指令模块包括：需求技能指令判断模块，用于识别流式语音指令，并判断所述流式语音指令是否是需求技能指令；流式尾句指令判断模块，用于识别并判断当前需求技能指令是否是一段流式尾句指令；其中，当需求技能指令是流式尾句指令时，判断下发执行的需求技能指令是否是用户感知不明显的车控指令；TTS播报模块，当识别下发执行的需求技能指令是用户感知不明显的车控指令时，进行无收尾TTS播报；当识别下发执行的需求技能指令是用户感知明显的车控指令时，无TTS播报。本发明的技术方案实现了人与机器之间下达操作命令边说边做的流畅体验。技术研发人员：姜志海,张礼元,赵晨纹,刘思宇,张时干,周伟朋,赵旻,蒋云峰,张发贵受保护的技术使用者：奇瑞汽车股份有限公司技术研发日：技术公布日：2024/4/17