技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于智能语音识别的设备交互方法、设备及介质与流程 > 正文

一种基于智能语音识别的设备交互方法、设备及介质与流程

国知局
2024-06-21 11:27:01

本说明书涉及人机交互的，尤其涉及一种基于智能语音识别的设备交互方法、设备及介质。

背景技术：

1、随着语音识别技术的显著进步，开始从实验室走向市场，语音识别技术进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。在但是在会议等领域，对于会议相关的设备的调度方式仍以鼠标键盘输入为主，输入方式比较落后，展示内容的灵活程度也因此受限。同时展示装置(通常为显示器)中的内容均为视觉信息，需要会员参与人员主动在大量的视觉信息中接收并识别其中的关键信息。因此，会议参与人员无法长时间、专注地接收会议内容。

技术实现思路

1、本说明书一个或多个实施例提供了一种基于智能语音识别的设备交互方法、设备及介质，用于解决如下技术问题：在会议场景中，设备调度方式不够灵活、展示内容单一，导致会议参与人员无法长时间集中精力。

2、本说明书一个或多个实施例采用下述技术方案：

3、本说明书一个或多个实施例提供一种基于智能语音识别的设备交互方法，所述方法包括：

4、基于预设语音采集装置获取用户输入的语音信息；

5、当设备处于播放状态时，基于预设语音播放装置播放用户输入的所述语音信息；

6、当设备处于控制状态时，基于预设语音识别模型，将所述语音信息转化为对应的文本信息；

7、基于预设关键词库，提取所述文本信息中的关键词，并确定所述关键词在所述预设关键词库中对应的指令关键词；

8、根据所述指令关键词触发控制指令，并基于所述控制指令对设备进行控制。

9、进一步地，所述基于预设关键词库，提取所述文本信息中的关键词，并确定所述关键词在所述预设关键词库中对应的指令关键词，包括：

10、基于最大匹配算法，从所述文本信息中抽取一段字符串；

11、将所述字符串与所述预设关键词库中的指令关键词进行匹配，得到匹配结果；

12、若所述匹配结果为匹配成功，则将所述指令关键词作为所述文本信息的关键词；

13、若所述匹配结果为匹配不成功，则从所述字符串中抽取子字符串，并重复执行将所述子字符串与所述预设关键词库中的指令关键词进行匹配的步骤，直至所述子字符串与所述预设关键词库中的指令关键词匹配成功或者所述子字符串不可再分。

14、进一步地，所述根据所述指令关键词触发控制指令信息，具体包括：

15、当所述文本信息对应的指令关键词与预设指令触发条件形成完整映射时，基于所述指令关键词对应的预设指令触发条件，触发所述预设指令触发条件对应的控制指令；

16、当所述文本信息对应的指令关键词与预设指令触发条件形成不完整映射时，对所述文本信息进行意图识别，确定所述文本信息对应的语义意图信息；

17、根据所述语义意图信息，触发控制指令。

18、进一步地，所述对所述文本信息进行意图识别，确定所述文本信息对应的语义意图信息，具体包括：

19、对所述文本信息进行词嵌入编码，得到所述文本信息对应的向量；

20、基于语义识别模型对所述向量进行分类，得到语义意图信息，所述语义识别模型为预先训练得到的神经网络模型。

21、进一步地，所述根据所述语义意图信息，触发控制指令，具体包括：

22、将所述语义意图信息与所述预设触发条件进行语义意图匹配；

23、当语义意图匹配成功时，触发所述预设触发条件对应的控制指令。

24、进一步地，所述基于所述控制指令对设备进行控制，具体包括：

25、基于所述控制指令，获取目标内容；

26、基于预设显示装置上显示所述目标内容或者基于所述预设播放装置播放所述目标内容。

27、进一步地，在所述基于所述控制指令对设备进行控制之后，还包括：

28、基于预设语音合成模型和所述目标内容，生成播报语音；

29、基于所述预设播放设备播放所述播报语音。

30、进一步地，所述基于预设语音识别模型，将所述语音信息转化为对应的文本信息，具体包括：

31、对所述语音内容进行划分，得到语音片段序列；

32、对所述语音片段序列进行特征提取，得到所述语音片段序列对应的语音特征信息序列；

33、对所述语音特征信息序列和预设字典进行比较与匹配，得到所述语音特征序列对应的文本单词序列；

34、将所述文本单词序列作为所述语音内容对应的文本内容。

35、本说明书一个或多个实施例提供一种基于智能语音识别的设备交互设备，包括：

36、至少一个处理器；以及，

37、与所述至少一个处理器通信连接的存储器；其中，

38、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

39、基于预设语音采集装置获取用户输入的语音信息；

40、当设备处于播放状态时，基于预设语音播放装置播放用户输入的所述语音信息；

41、当设备处于控制状态时，基于预设语音识别模型，将所述语音信息转化为对应的文本信息；

42、基于预设关键词库，提取所述文本信息中的关键词，并确定所述关键词在所述预设关键词库中对应的指令关键词；

43、根据所述指令关键词触发控制指令，并基于所述控制指令对设备进行控制。

44、本说明书一个或多个实施例提供的一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：

45、基于预设语音采集装置获取用户输入的语音信息；

46、当设备处于播放状态时，基于预设语音播放装置播放用户输入的所述语音信息；

47、当设备处于控制状态时，基于预设语音识别模型，将所述语音信息转化为对应的文本信息；

48、基于预设关键词库，提取所述文本信息中的关键词，并确定所述关键词在所述预设关键词库中对应的指令关键词；

49、根据所述指令关键词触发控制指令，并基于所述控制指令对设备进行控制。

50、本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果：本发明方案可以通过语音设备输入语音信息，输入的语音信息可以作为控制指令，也可以作为播放内容，会议中既可以展示视觉内容也可以播放语音内容，会议内容更加丰富多样，可以集中会议参与人员的精力。

技术特征：

1.一种基于智能语音识别的设备交互方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于智能语音识别的设备交互方法，其特征在于，所述基于预设关键词库，提取所述文本信息中的关键词，并确定所述关键词在所述预设关键词库中对应的指令关键词，包括：

3.根据权利要求2所述的一种基于智能语音识别的设备交互方法，其特征在于，所述根据所述指令关键词触发控制指令信息，具体包括：

4.根据权利要求3所述的一种基于智能语音识别的设备交互方法，其特征在于，所述对所述文本信息进行意图识别，确定所述文本信息对应的语义意图信息，具体包括：

5.根据权利要求4所述的一种基于智能语音识别的设备交互方法，其特征在于，所述根据所述语义意图信息，触发控制指令，具体包括：

6.根据权利要求1所述的一种基于智能语音识别的设备交互方法，其特征在于，所述基于所述控制指令对设备进行控制，具体包括：

7.根据权利要求6所述的一种基于智能语音识别的设备交互方法，其特征在于，在所述基于所述控制指令对设备进行控制之后，还包括：

8.根据权利要求1所述的一种基于智能语音识别的设备交互方法，其特征在于，所述基于预设语音识别模型，将所述语音信息转化为对应的文本信息，具体包括：

9.一种基于智能语音识别的设备交互设备，其特征在于，所述设备包括：

10.一种非易失性计算机存储介质，存储有计算机可执行指令，其特征在于，所述计算机可执行指令设置为：

技术总结本说明书实施例公开了一种基于智能语音识别的设备交互方法、设备及介质，涉及人机交互的技术领域，方法包括：基于预设语音采集装置获取用户输入的语音信息；当设备处于播放状态时，基于预设语音播放装置播放用户输入的所述语音信息；当设备处于控制状态时，基于预设语音识别模型，将所述语音信息转化为对应的文本信息；基于预设关键词库，提取所述文本信息中的关键词，并确定所述关键词在所述预设关键词库中对应的指令关键词；根据所述指令关键词触发控制指令，并基于所述控制指令对设备进行控制。技术研发人员：韩华兵,王相成,彭鹏,刘士朋受保护的技术使用者：浪潮通用软件有限公司技术研发日：技术公布日：2024/2/8