技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、系统、终端及存储介质与流程 > 正文

语音交互方法、系统、终端及存储介质与流程

国知局
2024-06-21 11:27:25

本发明涉及语音交互，尤其涉及一种语音交互方法、系统、终端及存储介质。

背景技术：

1、随着汽车智能化程度越来越高以及智能网联汽车的快速发展，车载语音技术作为车载人工智能的基础入口，其在语音交互场景中的准确率尤为重要。

2、在现有的车载场景中的语音识别，一般仅能实现语义精确的用户语音，当接收到语义模糊的用户语音时，则采用不执行用户语音的方式进行操作，导致用户使用体验低下。

技术实现思路

1、本发明实施例的目的在于提供一种语音交互方法、系统、终端及存储介质，旨在解决现有的语音交互过程中，用户使用体验低下的问题。

2、本发明实施例是这样实现的，一种语音交互方法，所述方法包括：

3、获取用户语音，并对所述用户语音进行语义识别，得到语义匹配度，所述语义匹配度用于表示所述用户语音的语义与预设语义之间最大的相似度；

4、若所述语义匹配度大于或等于第一匹配度阈值，则根据所述语义匹配度相对应的预设语义确定交互语音，并根据所述交互语音对用户进行语音交互；

5、若所述语义匹配度小于第一匹配度阈值，且大于第二匹配度阈值，则将所述用户语音确定为待唤醒语音，并返回执行所述获取用户语音的步骤；

6、若预设时长内获取到的所述用户语音满足语音唤醒条件，则根据所述待唤醒语音确定所述交互语音，并根据所述交互语音对用户进行语音交互。

7、优选的，返回执行所述获取用户语音的步骤之后，还包括：

8、对所述预设时长内获取到的所述用户语音进行语音识别，得到待检测文本，并将预设唤醒词与所述待检测文本进行词汇匹配；

9、若所述预设唤醒词与所述待检测文本之间的词汇匹配成功，则判定预设时长内获取到的所述用户语音满足语音唤醒条件；

10、若所述预设唤醒词与所述待检测文本之间的词汇未匹配成功，则判定当前获取到的所述用户语音未满足语音唤醒条件。

11、优选的，返回执行所述获取用户语音的步骤之后，还包括：

12、对所述预设时长内获取到的所述用户语音进行文本转换，得到待检测文本，并对所述待检测文本进行实体识别，得到文本实体；

13、将各文本实体的实体类型与预设类型进行匹配；

14、若任一所述文本实体的实体类型与所述预设类型相匹配，则判定预设时长内获取到的所述用户语音满足语音唤醒条件；

15、若各文本实体的实体类型与所述预设类型均未匹配，则判定当前获取到的所述用户语音未满足语音唤醒条件。

16、优选的，判定当前获取到的所述用户语音未满足语音唤醒条件的步骤之后，还包括：

17、将当前获取到的所述用户语音，返回执行所述对所述用户语音进行语义识别的步骤及后续步骤；

18、若当前获取到的所述用户语音的语义匹配度大于或等于第一匹配度阈值，则删除所述待唤醒语音；

19、若当前获取到的所述用户语音的语义匹配度小于第一匹配度阈值，且大于第二匹配度阈值，则根据当前获取到的所述用户语音对所述待唤醒语音进行语音更新。

20、优选的，返回执行所述获取用户语音的步骤之后，还包括：

21、若所述预设时长内未获取到所述用户语音，则删除所述待唤醒语音；

22、若所述预设时长内获取到的所述用户语音均未满足语音唤醒条件，则删除所述待唤醒语音。

23、优选的，对所述用户语音进行语义识别，得到语义匹配度，包括：

24、对所述用户语音进行语音识别，得到语音文本，并对所述语音文本进行分词处理，得到语音词汇串；

25、将所述语音词汇串与预设词汇串进行相似度计算，得到词汇串相似度，并将最大所述词汇串相似度确定为所述语义匹配度。

26、优选的，对所述用户语音进行语义识别，得到语义匹配度之后，还包括：

27、若所述语义匹配度小于或等于第二匹配度阈值，则删除所述用户语音。

28、本发明实施例的另一目的在于提供一种语音交互系统，所述系统包括：

29、语义识别模块，用于获取用户语音，并对所述用户语音进行语义识别，得到语义匹配度，所述语义匹配度用于表示所述用户语音的语义与预设语义之间最大的相似度；

30、第一交互模块，用于若所述语义匹配度大于或等于第一匹配度阈值，则根据所述语义匹配度相对应的预设语义确定交互语音，并根据所述交互语音对用户进行语音交互；

31、唤醒设置模块，用于若所述语义匹配度小于第一匹配度阈值，且大于第二匹配度阈值，则将所述用户语音确定为待唤醒语音，并返回执行所述获取用户语音的步骤；

32、第二交互模块，用于若预设时长内获取到的所述用户语音满足语音唤醒条件，则根据所述待唤醒语音确定所述交互语音，并根据所述交互语音对用户进行语音交互。

33、本发明实施例的另一目的在于提供一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述方法的步骤。

34、本发明实施例的另一目的在于提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述方法的步骤。

35、本发明实施例，通过将用户语音确定为待唤醒语音，方便了后续是否执行待唤醒语音的判断，若预设时长内获取到的用户语音满足语音唤醒条件时，基于待唤醒语音确定交互语音，基于交互语音对用户进行语音交互，本发明实施例，当接收到语义模糊的用户语音时，将用户语音设置为待唤醒语音，当检测到预设时长内获取到的用户语音满足语音唤醒条件时，唤醒待唤醒语音执行语音交互操作，有效地提高了语音交互的执行效率，提高了用户的使用体验。

技术特征：

1.一种语音交互方法，其特征在于，所述方法包括：

2.如权利要求1所述的语音交互方法，其特征在于，返回执行所述获取用户语音的步骤之后，还包括：

3.如权利要求1所述的语音交互方法，其特征在于，返回执行所述获取用户语音的步骤之后，还包括：

4.如权利要求2或3所述的语音交互方法，其特征在于，判定当前获取到的所述用户语音未满足语音唤醒条件的步骤之后，还包括：

5.如权利要求1所述的语音交互方法，其特征在于，返回执行所述获取用户语音的步骤之后，还包括：

6.如权利要求1所述的语音交互方法，其特征在于，对所述用户语音进行语义识别，得到语义匹配度，包括：

7.如权利要求1所述的语音交互方法，其特征在于，对所述用户语音进行语义识别，得到语义匹配度之后，还包括：

8.一种语音交互系统，其特征在于，所述系统包括：

9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

技术总结本发明提供了一种语音交互方法、系统、终端及存储介质，该方法包括：获取用户语音，对用户语音进行语义识别，得到语义匹配度；若语义匹配度小于第一匹配度阈值，且大于第二匹配度阈值，则将用户语音确定为待唤醒语音，返回执行获取用户语音的步骤；若预设时长内获取到的用户语音满足语音唤醒条件，则根据待唤醒语音确定所述交互语音，根据交互语音对用户进行语音交互。本发明实施例，通过将语义模糊的用户语音设置为待唤醒语音，当检测到预设时长内获取到的用户语音满足语音唤醒条件时，唤醒待唤醒语音执行语音交互操作，有效地提高了语音交互的执行效率，提高了用户的使用体验。技术研发人员：桂维忠,张泽宇,邱祎,黄盼受保护的技术使用者：云知声（杭州）智能科技有限公司技术研发日：技术公布日：2024/2/8