技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、服务器和计算机可读存储介质与流程 > 正文

语音交互方法、服务器和计算机可读存储介质与流程

国知局
2024-06-21 10:44:01

本申请涉及车载语音，特别涉及一种语音交互方法、服务器和计算机可读存储介质。

背景技术：

1、在语音交互过程中，槽位识别的准确率至关重要。目前相关技术中，对于用户语音请求中命名实体的复杂情况，识别效果不佳，可能发生错误，无法提取到期望得到的槽位结果，难以满足车载场景下的用户需求。

技术实现思路

1、本申请提供了一种语音交互方法、服务器及计算机可读存储介质。

2、本申请的语音交互方法，包括：

3、接收车辆转发的语音请求；

4、根据预设的资源库获取所述语音请求的附加信息；

5、根据所述附加信息对所述语音请求进行编码处理；

6、根据所述编码处理的结果对所述语音请求进行槽位识别；

7、对所述语音请求进行应用程序接口预测；

8、根据所述槽位识别的结果和预测到的应用程序接口，选择所述预测到的应用程序接口执行应用程序接口参数填充，输出执行结果下发至车辆完成语音交互。

9、如此，本申请实施方式的语音交互方法通过预设资源库获取语音请求的附加信息，并根据附加信息对语音请求进行编码处理，进而可根据编码处理后的结果对语音请求进行槽位识别。进而可根据槽位识别的结果以及槽位识别结果预测对应用程序接口进行参数填充，最终输出执行结果并下发至车辆，完成语音交互。本申请实施方式的语音交互方法，在槽位识别的过程中，引入资源库中存储的语音请求的附加信息，并根据附加信息对语音请求进行编码处理，使得附加信息编入语音请求的编码信息中，为槽位提取提供更多更全面的外部信息，从而可以有效地提升槽位识别的准确性，提高用户的语音交互体验。

10、在某些实施方式中，所述预设资源库存储有预设关键词及与所述预设关键词对应的标签信息，所述根据预设的资源库获取所述语音请求的附加信息，包括：

11、将所述语音请求与所述资源库中的关键词进行匹配；

12、根据所述匹配的结果确定与所述语音请求形成匹配的关键词的标签信息以获取所述附加信息。

13、如此，通过将语音请求与资源库中存储的关键词进行匹配，并根据匹配成功的关键词的标签信息，获取语音请求的附加信息，以便后续对语音请求进行编码处理。

14、在某些实施方式中，所述根据所述附加信息对所述语音请求进行编码处理，包括：

15、对所述语音请求进行文本序列编码处理，得到第一编码向量；

16、根据所述标签信息对应的编码信息对所述第一编码向量进行拼接处理以得到第二编码向量。

17、如此，对语音请求的文本序列进行编码处理，得到第一编码向量，根据标签信息对对应的编码信息对第一编码向量进行拼接处理，得到第二编码向量，第二编码向量中包含了标签信息的编码信息，原语音请求中的信息得以扩展，使得后续槽位识别的过程具有可依赖的外部资源信息。

18、在某些实施方式中，所述根据所述标签信息对应的编码信息对所述第一编码向量进行拼接处理以得到第二编码向量，包括：

19、在与所述语音请求中的第一片段形成的匹配的第一关键词具有多个标签信息的情况下，将所述多个标签信息分别对应的编码信息共同与所述第一编码向量进行所述拼接处理以得到所述第二编码向量。

20、如此，对于与语音请求中的某些实体形成匹配的同一关键词具有多个标签信息的情况，在编码过程中将这些标签信息逐一与语音请求的第一编码向量进行拼接，使得拼接处理后的第二编码向量，包括了该语音请求中存在与外部资源库中形成匹配的关键词的全部外部资源标签信息，增强了信息的全面性，有效避免因关键词的标签信息缺失而无法满足槽位识别需求的情况，槽位识别更加准确。

21、在某些实施方式中，所述方法还包括：

22、根据所述第二编码向量和所述语音请求的字符序列构建位置向量。

23、如此，可以通过构建位置向量的方式来指示标签信息编码所对应的语音请求中的实体的位置，从而得以进行槽位识别。

24、在某些实施方式中，所述根据所述第二编码向量和所述语音请求的字符序列构建位置向量，包括：

25、根据所述第二编码向量中每个编码对应于所述语音请求的字符序列中的起始位置，构建第一位置向量。

26、如此，可以构建第一位置向量，第一位置向量也即是第二编码向量中每个编码在语音请求的字符序列中的起始位置。

27、在某些实施方式中，所述根据所述第二编码向量和所述语音请求的字符序列构建位置向量，包括：

28、根据所述第二编码向量中每个编码对应于所述语音请求的字符序列中的结束位置，构建第二位置向量。

29、如此，可以构建第二位置向量，第二位置向量也即是第二编码向量中每个编码在语音请求的字符序列中的结束位置。

30、在某些实施方式中，所述根据所述编码处理的结果对所述语音请求进行槽位识别，包括：

31、根据所述第二编码向量、所述第一位置向量和所述第二位置向量对所述语音请求进行槽位识别。

32、如此，根据拼接处理得到的第二编码向量、构建的第一位置向量以及第二位置向量，可用以进行后续的槽位识别，在第二编码向量中包括了语音请求中对应外部资源库中的实体所具有的全部外部标签信息，根据第一位置向量、第二位置向量可确定以编码信息拼接至语音请求中的标签信息对应的语音请求中的实体，从而可进行后续的槽位识别。

33、本申请的服务器，包括处理器和存储器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述的方法。

34、本申请的计算机可读存储介质，存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现上述实施方式任一项所述的语音交互方法。

35、如此，本申请的服务器和计算机可读存储介质，通过预设资源库获取语音请求的附加信息，并根据附加信息对语音请求进行编码处理，进而可根据编码处理后的结果对语音请求进行槽位识别。进而可根据槽位识别的结果以及槽位识别结果预测对应用程序接口进行参数填充，最终输出执行结果并下发至车辆，完成语音交互。本申请实施方式的语音交互方法，在槽位识别的过程中，引入资源库中存储的语音请求的附加信息，并根据附加信息对语音请求进行编码处理，使得附加信息编入语音请求的编码信息中，为槽位提取提供更多更全面的外部信息，从而可以有效地提升槽位识别的准确性，提高用户的语音交互体验。

36、本申请实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

技术特征：

1.一种语音交互方法，其特征在于，包括：

2.根据权利要求1所述的语音交互方法，其特征在于，所述预设资源库存储有预设关键词及与所述预设关键词对应的标签信息，所述根据预设的资源库获取所述语音请求的附加信息，包括：

3.根据权利要求2所述的语音交互方法，其特征在于，所述根据所述附加信息对所述语音请求进行编码处理，包括：

4.根据权利要求3所述的语音交互方法，其特征在于，所述根据所述标签信息对应的编码信息对所述第一编码向量进行拼接处理以得到第二编码向量，包括：

5.根据权利要求3或4所述的语音交互方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的语音交互方法，其特征在于，所述根据所述第二编码向量和所述语音请求的字符序列构建位置向量，包括：

7.根据权利要求6所述的语音交互方法，其特征在于，所述根据所述第二编码向量和所述语音请求的字符序列构建位置向量，包括：

8.根据权利要求7所述的语音交互方法，其特征在于，所述根据所述编码处理的结果对所述语音请求进行槽位识别，包括：

9.一种服务器，其特征在于，所述服务器包括处理器和存储器，所述存储器上存储有计算机程序，当所述计算机程序被所述处理器执行时，实现权利要求1-8任一项所述的语音交互方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被一个或多个处理器执行的情况下，实现如权利要求1-8任一项所述的方法。

技术总结本申请公开了一种语音交互方法，包括：接收车辆转发的语音请求，根据预设的资源库获取语音请求的附加信息，根据附加信息对语音请求进行编码处理，根据编码处理的结果对语音请求进行槽位识别，对语音请求进行应用程序接口预测，根据槽位识别的结果和预测到的应用程序接口，选择预测到的应用程序接口执行应用程序接口参数填充，输出执行结果下发至车辆完成语音交互。本申请实施方式的语音交互方法，在槽位识别的过程中，引入资源库中存储的语音请求的附加信息，并根据附加信息对语音请求进行编码处理，使得附加信息编入语音请求的编码信息中，为槽位提取提供更多更全面的外部信息，从而可以有效地提升槽位识别的准确性，提高用户的语音交互体验。技术研发人员：丁鹏傑,赵群,宁洪珂,樊骏锋,朱麒宇受保护的技术使用者：广州小鹏汽车科技有限公司技术研发日：技术公布日：2024/2/1