技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、服务器以及存储介质与流程 > 正文

语音交互方法、服务器以及存储介质与流程

国知局
2024-06-21 11:38:28

本申请涉及车辆语音处理，具体涉及一种语音交互方法、服务器以及计算机可读存储介质。

背景技术：

1、当前智能音响、车辆主机等智能控制中心可以接入越来越多的设备，例如音响、空调、门窗控制等。用户可以通过语音，对控制中心下达指令，进而对目标设备或功能进行控制，例如启动空调。目前常用的技术方案是人为定义用户可以执行的、不可再分的功能点，比如启动空调等等，然后针对每一个不可再分的功能点通过人工转写或者预设模板来生成对应的语音请求数据集，再根据相关的神经网络来实现从用户的实际语音请求出发控制功能点执行的过程。但这样的方式在数据更新方面存在较大的障碍，若功能点出现增删或者变化，需要从编写数据集开始重新来过。

技术实现思路

1、本申请提供了一种语音交互方法、服务器以及计算机可读存储介质。

2、本申请实施方式涉及的语音交互方法，包括：

3、根据预存储的设备列表、提示文本以及预设的大语言模型，确定与所述设备列表中各设备项对应的车辆功能点描述数据；

4、确定所述车辆功能点描述数据以及当前语音请求间的相似度参数；

5、根据所述相似度参数，确定所述当前语音请求对应的车辆功能点。

6、如此，本申请能够根据车辆自身的设备、以及针对预设大语言模型的提示文本，生成对应于车辆自身设备各个最小功能点的描述数据，并在实际应用过程中根据描述数据自身与用户输入的语音请求进行相似度比较，根据比较结果确定出用户通过语音请求希望触发的功能点并执行，完成语音交互过程。通过大语言模型针对功能点描述数据的生成过程，大大简化了数据集的生成过程，同时提高的数据集中的数据更新效率。

7、在某些实施方式中，所述根据预存储的设备列表、提示文本以及预设的大语言模型，确定与所述设备列表中各设备项对应的车辆功能点描述数据，包括：

8、获取预存储的设备列表；

9、根据所述设备列表中的各设备项、第一提示文本以及所述大语言模型，确定与所述设备列表中的各设备项对应的车辆功能点，其中所述第一提示文本包括用于表示车辆功能的动词、名词、动词性短语或名词性短语；

10、根据所述车辆功能点，确定与所述设备列表中各设备项对应的车辆功能点描述数据。

11、如此，本申请能够根据车辆预存储的用于描述车辆上安装的各个设备的设备列表，以每项对应的设备为基准，配合填入的提示文本，由大语言模型输出设备对应的各个不可再分的最小功能点，并以得到的每一个最小功能点为基准进一步确定功能点的描述数据。

12、在某些实施方式中，所述根据所述车辆功能点，确定与所述设备列表中各设备项对应的车辆功能点描述数据，包括：

13、根据所述车辆功能点、第二提示文本以及所述大语言模型，确定与所述设备列表中各设备项对应的车辆功能点描述数据，其中所述第二提示文本包括用于描述车辆功能的语句。

14、如此，本申请能够进一步利用提供给大语言模型的功能描述语句，由大语言模型生成与最小功能点相对应的描述语句数据。

15、在某些实施方式中，所述确定所述车辆功能点描述数据以及当前语音请求间的相似度参数，包括：

16、根据所述车辆功能点描述数据以及预设的句向量生成规则，确定所述车辆功能点描述数据的第一特征句向量；

17、根据所述当前语音请求以及预设的句向量生成规则，确定所述当前语音请求的第二特征句向量；

18、根据所述第一特征句向量以及所述第二特征句向量，确定所述相似度参数。

19、如此，本申请能够根据每一条功能点描述语句以及用户通过发声输入的语音请求转化而来的文字的特征句向量，来计算功能点描述语句与语音请求转化而来的文字之间的相似度参数。

20、在某些实施方式中，所述根据所述当前语音请求以及预设的句向量生成规则，确定所述当前语音请求的第二特征句向量，包括：

21、根据接收到的所述当前语音请求以及预设的语音识别模型，确定所述当前语音请求对应的语音请求文本；

22、根据所述语音请求文本以及预设的句向量生成规则，确定所述当前语音请求的第二特征句向量。

23、如此，本申请还提供了确定第二特征句向量的具体方式。

24、在某些实施方式中，所述根据所述第一特征句向量以及所述第二特征句向量，确定所述相似度参数，包括：

25、将所述第一特征句向量以及所述第二特征句向量的余弦相似度，确定为所述相似度参数。

26、如此，本申请还提供了相似度参数的具体表现形式。

27、在某些实施方式中，所述根据所述相似度参数，确定所述当前语音请求对应的车辆功能点，包括：

28、将所述相似度参数满足预设条件的所述车辆功能点描述数据对应的车辆功能点，确定为与所述当前语音请求对应的车辆功能点。

29、如此，本申请提供了确定与语音请求对应的车辆功能点的方式。

30、在某些实施方式中，所述根据所述相似度参数，确定所述当前语音请求对应的车辆功能点，包括：

31、根据所述余弦相似度，对与所述设备列表中各设备项对应的车辆功能点描述数据进行排序；

32、将所述余弦相似度大于预设阈值的所述车辆功能点描述数据对应的车辆功能点，确定为与所述当前语音请求对应的车辆功能点。

33、如此，本申请提供了根据余弦相似度在预排列顺序的情况下筛选出目标车辆功能点的方式。

34、本申请实施方式中的服务器包括存储器与处理器，所述存储器存储有计算机程序，在所述计算机程序被所述处理器执行的情况下，实现上述的方法。

35、本申请实施方式中的计算机可读存储介质存储有计算机程序，在所述计算机程序被一个或多个处理器执行的情况下，实现上述的方法。

36、本申请的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实施方式的实践了解到。

技术特征：

1.一种语音交互方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据预存储的设备列表、提示文本以及预设的大语言模型，确定与所述设备列表中各设备项对应的车辆功能点描述数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述车辆功能点，确定与所述设备列表中各设备项对应的车辆功能点描述数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述确定所述车辆功能点描述数据以及当前语音请求间的相似度参数，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述当前语音请求以及预设的句向量生成规则，确定所述当前语音请求的第二特征句向量，包括：

6.根据权利要求4所述的方法，其特征在于，所述根据所述第一特征句向量以及所述第二特征句向量，确定所述相似度参数，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据所述相似度参数，确定所述当前语音请求对应的车辆功能点，包括：

8.根据权利要求6所述的方法，其特征在于，所述根据所述相似度参数，确定所述当前语音请求对应的车辆功能点，包括：

9.一种服务器，其特征在于，所述服务器包括存储器与处理器，所述存储器存储有计算机程序，在所述计算机程序被所述处理器执行的情况下，实现如权利要求1-8任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，在所述计算机程序被一个或多个处理器执行的情况下，实现如权利要求1-8任一项所述的方法。

技术总结本申请公开了一种语音交互方法，包括：根据预存储的设备列表、提示文本以及预设的大语言模型，确定与设备列表中各设备项对应的车辆功能点描述数据；确定车辆功能点描述数据以及当前语音请求间的相似度参数；根据相似度参数，确定当前语音请求对应的车辆功能点。本申请能够根据车辆自身的设备、以及针对预设大语言模型的提示文本，生成对应于车辆自身设备各个最小功能点的描述数据，并在实际应用过程中根据描述数据自身与用户输入的语音请求进行相似度比较，根据比较结果确定出用户通过语音请求希望触发的功能点并执行，完成语音交互过程。通过大语言模型针对功能点描述数据的生成，大大简化数据集的生成过程，同时提高数据集中的数据更新效率。技术研发人员：谢扬帆,李嘉辉,陈光毅,曹川,汪建受保护的技术使用者：广州小鹏汽车科技有限公司技术研发日：技术公布日：2024/3/24