技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于语音识别的机器人控制方法及系统与流程 > 正文

一种基于语音识别的机器人控制方法及系统与流程

国知局
2024-10-09 14:55:26

本申请涉及到机器人，特别是涉及到一种基于语音识别的机器人控制方法及系统。

背景技术：

1、机器人现已被广泛地应用于生产和生活的许多领域，语音识别技术也在过去的二十年里获取了显著的进展，随着讯飞等语音公司产品的上市，语音识别技术渐渐从实验室走向市场。经过市场的迭代与语音识别研究工作的不断发展，目前各大公司推出的语音识别产品的识别精度已经很高了，足以满足市场用户的需求，并在许多领域实现应用，所以在智能服务机器人领域，通过语音识别的人机交互平台的智能服务机器人的应用也应运而生。因此如何通过语音识别技术对机器人进行控制的问题亟待解决。

技术实现思路

1、本申请的主要目的为提供一种基于语音识别的机器人控制方法及系统，旨在通过语音识别技术对机器人进行控制。

2、为了实现上述发明目的，本申请提出一种基于语音识别的机器人控制方法，包括：

3、一种基于语音识别的机器人控制方法，包括：

4、获取用户的语音信息并对所述语音信息进行预处理，得到第一语音信息；

5、对所述第一语音信息进行特征提取，得到频谱信息、时域信息、基频信息和声道特征；

6、将所述频谱信息、所述时域信息、所述基频信息和所述声道特征进行特征融合，得到多特征融合向量；

7、构建语音识别模型，将所述多特征融合向量输入到所述语音识别模型中进行语言识别，得到语音识别结果；

8、基于所述语音识别结果与机器人命令库进行相似度匹配，得到第一相似度；

9、基于所述第一相似度确定是否对所述机器人进行控制。

10、进一步地，所述获取用户的语音信息并对所述语音信息进行预处理，得到第一语音信息，具体包括：

11、根据模数转换将所述语音信息转换为数字信息；

12、对所述语言信息进行降噪处理，得到降噪处理后的语音信息；

13、将所述降噪处理后的语音信息进行语言分段，得到多个语音段信息，即为第一语言信息。

14、进一步地，所述将所述频谱信息、所述时域信息、所述基频信息和所述声道特征进行特征融合，得到多特征融合向量，具体包括：

15、基于卷积神经网络将所述频谱信息、所述时域信息、所述基频信息和所述声道特征进行特征融合分别转换为所述频谱特征向量、所述时域特征向量、所述基频特征向量和所述声道特征向量；

16、分别对所述频谱特征向量、所述时域特征向量、所述基频特征向量和所述声道特征向量赋予权重，得到对应的权重系数；

17、分别对所述频谱特征向量、所述时域特征向量、所述基频特征向量和所述声道特征向量与其对应的权重系数进行相乘，得到对应的加权特征向量；

18、将所述频谱特征向量、所述时域特征向量、所述基频特征向量和所述声道特征向量对应的加权特征向量进行线性相加，得到多特征融合向量。

19、进一步地，所述构建语音识别模型，将所述多特征融合向量输入到所述语音识别模型中进行语言识别，得到语音识别结果的步骤之前，具体包括：

20、获获取历史多特征信息融合向量，并将所述历史多特征信息融合向量集分为训练集和测试集；

21、基于所述训练集对所述语音识别模型进行训练，并基于所述测试集对所述语音识别模型进行测试，直至所述语音识别模型的语言识别准确性满足预设准确性阈值，停止对所述语音识别模型进行训练。

22、进一步地，所述基于所述语音识别结果与机器人命令库进行相似度匹配，得到第一相似度，具体包括：

23、将所述语音识别结果转换为文本信息；

24、对所述文本信息进行提取，得到关键信息；

25、基于自然语言处理技术将所述关键信息与所述机器人命令库进行匹配并进行相似度的计算，得到相似度分数；

26、将所述相似度分数进行比较，得到最大相似度分数，即为第一相似度。

27、进一步地，所述基于所述第一相似度对所述机器人进行控制的步骤之前，具体包括：

28、获取语音识别结果对应的音素；

29、将所述音素与预设音素库进行一一对应，得到关键音素和非关键音素；

30、基于所述预设音素库中对应标注音素的特征值标签获取所述关键音素的特征值和所述非关键音素的特征值；

31、比较所述关键音素的特征值和所述非关键音素的特征值；

32、当所述关键音素的特征值大于等于所述非关键音素的特征值，则为正确的唤醒指令；

33、当所述关键音素的特征值小于所述非关键音素的特征值，则为不正确的唤醒指令。

34、进一步地，所述基于所述第一相似度对所述机器人进行控制，具体包括：

35、判断所述第一相似度是否大于预设阈值；

36、当所述第一相似度大于等于预设阈值时，执行语音识别结果对应的命令；

37、当所述第一相似度于小于预设阈值时，执行再次提醒命令。

38、一种基于语音识别的机器人控制系统，所述系统包括：

39、第一语音信息模块，用于获取用户的语音信息并对所述语音信息进行预处理，得到第一语音信息；

40、特征提取模块，用于对所述第一语音信息进行特征提取，得到频谱信息、时域信息、基频信息和声道特征；

41、多特征融合向量模块，用于将所述频谱信息、所述时域信息、所述基频信息和所述声道特征进行特征融合，得到多特征融合向量；

42、语音识别模块，用于构建语音识别模型，将所述多特征融合向量输入到所述语音识别模型中进行语言识别，得到语音识别结果；

43、第一相似度模块，用于基于所述语音识别结果与机器人命令库进行相似度匹配，得到第一相似度；

44、控制模块，用于基于所述第一相似度对所述机器人进行控制。

45、本申请还提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项基于语音识别的机器人控制方法的步骤。

46、本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的基于语音识别的机器人控制方法的步骤。

47、本申请涉及机器人技术领域，特别是涉及到一种基于语音识别的机器人控制方法及系统，所述方法包括：获取用户的语音信息并对所述语音信息进行预处理，得到第一语音信息；对所述第一语音信息进行特征提取，得到频谱信息、时域信息、基频信息和声道特征；将所述频谱信息、所述时域信息、所述基频信息和所述声道特征进行特征融合，得到多特征融合向量；构建语音识别模型，将所述多特征融合向量输入到所述语音识别模型中进行语言识别，得到语音识别结果；基于所述语音识别结果与机器人命令库进行相似度匹配，得到第一相似度；基于所述第一相似度确定是否对所述机器人进行控制。通过上述方法实现了基于语音识别技术对机器人进行控制。

技术特征：

1.一种基于语音识别的机器人控制方法，其特征在于，包括：

2.如权利要求1所述的一种基于语音识别的机器人控制方法，其特征在于，所述获取用户的语音信息并对所述语音信息进行预处理，得到第一语音信息，具体包括：

3.如权利要求1所述的一种基于语音识别的机器人控制方法，其特征在于，所述将所述频谱信息、所述时域信息、所述基频信息和所述声道特征进行特征融合，得到多特征融合向量，具体包括：

4.如权利要求1所述的一种基于语音识别的机器人控制方法，其特征在于，所述构建语音识别模型，将所述多特征融合向量输入到所述语音识别模型中进行语言识别，得到语音识别结果的步骤之前，具体包括：

5.如权利要求1所述的一种基于语音识别的机器人控制方法，其特征在于，所述基于所述语音识别结果与机器人命令库进行相似度匹配，得到第一相似度，具体包括：

6.如权利要求1所述的一种基于语音识别的机器人控制方法，其特征在于，所述基于所述第一相似度对所述机器人进行控制的步骤之前，具体包括：

7.如权利要求1所述的一种基于语音识别的机器人控制方法，其特征在于，所述基于所述第一相似度对所述机器人进行控制，具体包括：

8.一种基于语音识别的机器人控制系统，其特征在于，所述系统包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的基于语音识别的机器人控制方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于语音识别的机器人控制方法的步骤。

技术总结本申请涉及机器人技术领域，特别是涉及到一种基于语音识别的机器人控制方法及系统，所述方法包括：获取用户的语音信息并对所述语音信息进行预处理，得到第一语音信息；对所述第一语音信息进行特征提取，得到频谱信息、时域信息、基频信息和声道特征；将所述频谱信息、所述时域信息、所述基频信息和所述声道特征进行特征融合，得到多特征融合向量；构建语音识别模型，将所述多特征融合向量输入到所述语音识别模型中进行语言识别，得到语音识别结果；基于所述语音识别结果与机器人命令库进行相似度匹配，得到第一相似度；基于所述第一相似度确定是否对所述机器人进行控制。通过上述方法实现了基于语音识别技术对机器人进行控制。技术研发人员：李峰,邱丽萍受保护的技术使用者：瑞金木塔文化传播有限公司技术研发日：技术公布日：2024/9/29