技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音控制方法、装置、介质及车辆与流程 > 正文

语音控制方法、装置、介质及车辆与流程

国知局
2024-06-21 11:27:07

本发明涉及汽车，尤其涉及一种语音控制方法、装置、介质及车辆。

背景技术：

1、目前，各大车厂设计和开发智能语音产品时，通常需要预先进行产品定义，即定义好可以识别的语音指令及其相应的执行任务。当用户输入的语音指令在预定义范围内时，智能语音产品可以正确理解和执行相应的任务。然而，如果用户输入的语音指令不在预定义范围内，智能语音产品往往无法识别和理解用户的意图，也就无法执行相应的任务。

技术实现思路

1、为了解决上述技术问题，本发明实施例提出了一种语音控制方法、装置、介质及车辆。

2、本发明实施例提供了一种语音控制方法，包括：

3、接收用户的语音指令，当判定所述语音指令未预先定义时，执行以下步骤：

4、对所述语音指令进行语义理解处理，得到语义理解结果；

5、至少基于所述语义理解结果，从整车能力数据库所包含的由车辆提供的多个交互功能中确定目标车辆技能；

6、根据所述目标车辆技能对所述车辆进行控制。

7、进一步的，所述至少基于所述语义理解结果，从整车能力数据库所包含的由车辆提供的多个交互功能中确定目标车辆技能，包括：

8、在所述整车能力数据库中进行搜索，以判断是否存在与所述语义理解结果相匹配的交互功能；

9、若存在，则将与所述语义理解结果相匹配的交互功能确定为目标车辆技能。

10、进一步的，所述语义理解结果包括第一关键词；所述整车能力数据库还包括与各交互功能对应的第二关键词，其中，所述第二关键词包括以下至少一项：用于指示对应的交互功能所属领域的第三关键词、用于指示对应的交互功能的相关实体的第四关键词；

11、则，所述在所述整车能力数据库中进行搜索，以判断是否存在与所述语义理解结果相匹配的交互功能，包括：

12、在所述整车能力数据库中进行搜索，以判断是否存在与所述第一关键词之间的相似度高于预设的相似度阈值的第二关键词；

13、若存在与所述第一关键词之间的相似度高于预设的相似度阈值的第二关键词，则在所述整车能力数据库中，查找得到与所述相似度最高的第二关键词对应的交互功能，以作为与所述语义理解结果相匹配的交互功能。

14、进一步的，若不存在与所述语义理解结果相匹配的交互功能，则所述方法还包括：

15、至少基于所述语义理解结果和所述整车能力数据库，通过大模型规划得到对话目标；其中，所述对话目标用于表征待确认交互功能及其对应的待确认意图，所述待确认交互功能是所述多个交互功能中的一个；

16、利用所述大模型确定所述待确认意图的意图匹配置信度；

17、若所述意图匹配置信度大于预设的置信度阈值，则将所述待确认交互功能确定为所述目标车辆技能。

18、进一步的，若所述意图匹配置信度小于等于预设的置信度阈值，则所述方法还包括：

19、根据所述对话目标，确定所述待确认交互功能的所属领域及相关实体；

20、至少基于所述待确认意图、所述所属领域及所述相关实体，利用所述大模型生成问句并推荐给所述用户；

21、基于反馈信息确定目标车辆技能；其中，所述反馈信息是所述用户针对所述问句反馈的。

22、进一步的，所述基于反馈信息确定目标车辆技能，包括：

23、在所述反馈信息表征所述用户确认所述问句的情况下，将所述待确认交互功能确定为所述目标车辆技能；

24、在所述反馈信息表征所述用户否认所述问句的情况下，根据所述反馈信息，通过所述大模型调整所述语义理解结果，以重新执行所述至少基于所述语义理解结果和所述整车能力数据库，通过所述大模型规划得到对话目标及之后的步骤。

25、进一步的，所述方法还包括：

26、获取第一参考信息；其中，所述第一参考信息包括以下至少一项：所述用户对应的个人历史数据、预设的群体历史数据；

27、则，所述至少基于所述语义理解结果和所述整车能力数据库，通过所述大模型规划得到对话目标，包括：

28、将所述第一参考信息和预设模型激励输入到所述大模型，得到所述大模型输出的用户习惯；

29、基于所述语义理解结果、所述整车能力数据库及所述用户习惯，通过所述大模型规划得到对话目标。

30、进一步的，所述方法还包括：

31、获取第二参考信息；其中，所述第二参考信息包括以下至少一项：获取到的当前车内外环境信息、所述用户对应的个人历史数据、预设的群体历史数据；

32、则，所述至少基于所述待确认意图、所述所属领域及所述相关实体，利用所述大模型生成问句，包括：

33、基于所述待确认意图、所述所属领域及所述相关实体，通过所述大模型生成待填槽句式；

34、将所述第二参考信息和预设模型激励输入到所述大模型，得到所述大模型输出的填充参数；

35、将所述填充参数填充到所述待填槽句式，得到所述问句。

36、进一步的，所述根据所述目标车辆技能对所述车辆进行控制，包括：

37、调用与所述目标车辆技能对应的脚本，以控制所述车辆执行所述目标车辆技能。

38、进一步的，所述语义理解处理通过大模型或者小模型进行。

39、本发明实施例还提供了一种语音控制装置，包括：

40、语音获取模块，用于接收用户的语音指令，当判定所述语音指令未预先定义时，调用以下模块：

41、语义理解模块，用于对所述语音指令进行语义理解处理，得到语义理解结果；

42、目标车辆技能确定模块，用于至少基于所述语义理解结果，从整车能力数据库所包含的由车辆提供的多个交互功能中确定目标车辆技能；

43、控制模块，用于根据所述目标车辆技能对所述车辆进行控制。

44、本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的语音控制方法的步骤。

45、本发明实施例还提供了一种车辆，包括上述所述的语音控制装置。

46、综上，本发明具有以下有益效果：

47、采用本发明实施例，通过接收用户的语音指令，当判定所述语音指令未预先定义时，执行以下步骤：对所述语音指令进行语义理解处理，得到语义理解结果；至少基于所述语义理解结果，从整车能力数据库所包含的由车辆提供的多个交互功能中确定目标车辆技能；根据所述目标车辆技能对所述车辆进行控制，从而能够在语音指令未预先定义的情况下，精准预测语音指令所代表的含义并调用相应的交互功能。

技术特征：

1.一种语音控制方法，其特征在于，包括：

2.如权利要求1所述的语音控制方法，其特征在于，所述至少基于所述语义理解结果，从整车能力数据库所包含的由车辆提供的多个交互功能中确定目标车辆技能，包括：

3.如权利要求2所述的语音控制方法，其特征在于，所述语义理解结果包括第一关键词；所述整车能力数据库还包括与各交互功能对应的第二关键词，其中，所述第二关键词包括以下至少一项：用于指示对应的交互功能所属领域的第三关键词、用于指示对应的交互功能的相关实体的第四关键词；

4.如权利要求2所述的语音控制方法，其特征在于，若不存在与所述语义理解结果相匹配的交互功能，则所述方法还包括：

5.如权利要求4所述的语音控制方法，其特征在于，若所述意图匹配置信度小于等于预设的置信度阈值，则所述方法还包括：

6.如权利要求5所述的语音控制方法，其特征在于，所述基于反馈信息确定目标车辆技能，包括：

7.如权利要求4-6任一项所述的语音控制方法，其特征在于，所述方法还包括：

8.如权利要求5或6所述的语音控制方法，其特征在于，所述方法还包括：

9.如权利要求1-6任一项所述的语音控制方法，其特征在于，所述根据所述目标车辆技能对所述车辆进行控制，包括：

10.如权利要求1-6任一项所述的语音控制方法，其特征在于，所述语义理解处理通过大模型或者小模型进行。

11.一种语音控制装置，其特征在于，包括：

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-10任一项所述的语音控制方法。

13.一种车辆，其特征在于，包括如权利要求11所述的语音控制装置。

技术总结本发明公开了一种语音控制方法、装置、介质及车辆，所述方法包括：接收用户的语音指令，当判定所述语音指令未预先定义时，执行以下步骤：对所述语音指令进行语义理解处理，得到语义理解结果；至少基于所述语义理解结果，从整车能力数据库所包含的由车辆提供的多个交互功能中确定目标车辆技能；根据所述目标车辆技能对所述车辆进行控制，从而能够在语音指令未预先定义的情况下，精准预测语音指令所代表的含义并调用相应的交互功能。技术研发人员：李谦,陈文豪受保护的技术使用者：华人运通（上海）云计算科技有限公司技术研发日：技术公布日：2024/2/8