技术新讯 > 乐器声学设备的制造及制作,分析技术 > 移动终端的语音控制方法及装置与流程 > 正文

移动终端的语音控制方法及装置与流程

国知局
2024-06-21 11:46:37

本发明涉及数据传输领域，具体而言，涉及一种移动终端的语音控制方法及装置。

背景技术：

1、中文语音识别是一种将中文口语转换为文本的技术，通常涉及声学模型和语言模型。随着手机等各种移动设备的广泛使用，移动设备的使用环境和场景得到了更大程度的扩展。一般而言，对于移动终端如手机来说，语音识别的过程可以在本地上进行，也可以在云服务器上进行。目前，在一些使用环境和场景中，由于网络信号弱等原因，只能选择在本地进行语音识别。而在本地设备上进行语音识别由于资源和计算能力的限制，其存在准确性低的问题。

技术实现思路

1、基于此，有必要提供一种移动终端的语音控制方法及装置。

2、为了实现上述目的，本申请实施例提供了一种移动终端的语音控制方法，该方法包括：

3、捕捉音频信号；

4、对音频信号进行预处理，得到预处理音频信号；

5、将预处理音频信号转换为特征向量，使用预训练的语音识别模型对特征向量进行分析，得到文本数据；

6、将文本数据转换为拼音数据；

7、根据预设关键词库，得到关键词的拼音字符；

8、根据拼音字符和拼音数据，检测拼音数据中是否存在拼音字符的首部分；首部分为拼音字符的前n个字母；

9、在检测的结果为是的情况下，于拼音数据的首部分的后m个字母中确定是否存在拼音字符的尾部分；尾部分为所述拼音字符的后i个字母；

10、在确定存在拼音字符的尾部分的情况下，将拼音数据与关键词匹配，并根据匹配到的关键词控制移动终端。

11、另一方面，本申请实施例提供了一种移动终端的语音控制装置，包括：

12、信号采集模块，用于捕捉音频信号；

13、预处理模块，用于对所述音频信号进行预处理，得到预处理音频信号；

14、第一转换模块，用于将所述预处理音频信号转换为特征向量，使用预训练的语音识别模型对所述特征向量进行分析，得到文本数据；

15、第二转换模块，用于将所述文本数据转换为拼音数据；

16、拼音字符获取模块，用于根据预设关键词库，得到关键词的拼音字符；

17、第一检测模块，用于根据所述拼音字符和所述拼音数据，检测所述拼音数据中是否存在所述拼音字符的首部分；所述首部分为所述拼音字符的前n个字母；

18、第二检测模块，用于在所述检测的结果为是的情况下，于所述拼音数据的首部分的后m个字母中确定是否存在所述拼音字符的尾部分；所述尾部分为所述拼音字符的后i个字母；

19、执行模块，用于在确定存在所述拼音字符的尾部分的情况下，将所述拼音数据与所述关键词匹配，并根据匹配到的关键词控制移动终端。

20、上述技术方案中的一个技术方案具有如下优点和有益效果：

21、上述移动终端的语音控制方法，可以在本地设备中运行语音处理，并实现语音识别和关键词的匹配，相较于传统语音识别需要用到利用识别模型进行声音向量分析以及采用语音模型选择最可能的文字，本申请利用拼音进行控制，无需考虑文字的准确性即可满足语音控制的准确性需求。

技术特征：

1.一种移动终端的语音控制方法，其特征在于，包括：

2.根据权利要求1所述的移动终端的语音控制方法，其特征在于，将所述文本数据转换为拼音数据的步骤，包括：

3.根据权利要求2所述的移动终端的语音控制方法，其特征在于，在捕捉音频信号的步骤之前，包括：

4.根据权利要求1所述的移动终端的语音控制方法，其特征在于，还包括：在所述检测的结果为否的情况下，丢弃所述音频信号。

5.根据权利要求4所述的移动终端的语音控制方法，其特征在于，还包括：

6.根据权利要求1-5任一项所述的移动终端的语音控制方法，其特征在于，预训练的语音识别模型为循环神经网络模型。

7.一种移动终端的语音控制，其特征在于，包括：

技术总结本发明涉及一种移动终端的语音控制方法及装置。其中，移动终端的语音控制方法，可以在本地设备中运行语音处理，并实现语音识别和关键词的匹配，相较于传统语音识别需要用到利用识别模型进行声音向量分析以及采用语音模型选择最可能的文字，本申请利用拼音进行控制，无需考虑文字的准确性即可满足语音控制的准确性需求。技术研发人员：陈才立受保护的技术使用者：陈才立技术研发日：技术公布日：2024/4/24