技术新讯 > 乐器声学设备的制造及制作,分析技术 > 智能语音鼠标的控制方法及智能语音鼠标与流程 > 正文

智能语音鼠标的控制方法及智能语音鼠标与流程

国知局
2024-06-21 11:54:43

本申请涉及智能控制领域，且更为具体地，涉及一种智能语音鼠标的控制方法及智能语音鼠标。

背景技术：

1、智能语音鼠标是一种计算机鼠标，它集成了语音识别功能，允许用户通过语音命令控制计算机，为用户提供了与计算机互动的新方式。通过语音命令控制计算机，用户可以免除使用传统鼠标和键盘的繁琐操作，从而提高工作效率。

2、然而，由于使用者所处的办公场景各不相同，且每个用户在进行鼠标语音控制时，发出的语音命令在文字、语速、音色、语气等方面也不完全相同。传统语音鼠标在嘈杂的环境中可能难以使用，因为它们容易受到背景噪音的干扰，以此造成用户语音命令识别准确率不高的现象，从而影响了智能语音鼠标的办公效率和用户体验。

3、因此，期望一种优化的智能语音鼠标的控制方案。

技术实现思路

1、为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种智能语音鼠标的控制方法及智能语音鼠标，其利用基于语音信号处理、语音识别和语义理解技术对实时语音数据进行处理。具体地，首先构建场景化数据库，然后基于所述场景化数据库对实时语音数据依次进行场景降噪和语音识别以得到实时语音识别结果，以此根据所述实时语音识别结果来智能地生成控制指令。通过这样的方式，能够显著提高用户语音识别的准确性，并可以根据用户的个人偏好和使用习惯进行定制，从而为用户提供个性化的智能语音鼠标使用体验，以提高用户的工作效率。

2、根据本申请的一方面，提供了一种智能语音鼠标的控制方法，其包括：

3、构建场景化数据库，其中，所述场景化数据库包括噪声特征和与所述噪声特征对应的参考噪声信号分量；

4、基于所述场景化数据库，对实时语音数据进行场景降噪以得到降噪后语音数据；

5、对所述降噪后语音数据进行语音识别以得到实时语音识别结果；

6、基于所述实时语音识别结果，生成控制指令。

7、在上述智能语音鼠标的控制方法中，基于所述场景化数据库，对实时语音数据进行场景降噪以得到降噪后语音数据，包括：将所述实时语音数据通过噪声分量过滤器以得到实时语音噪声分量；提取所述实时语音噪声分量的实时语音噪声特征；对所述实时语音噪声特征和所述场景化数据库进行匹配分析以得到匹配结果，所述匹配结果为所述场景化数据库中的其中一个参考噪声信号分量；以及，计算所述实时语音数据和所述参考噪声信号分量之间的差分以得到所述降噪后语音数据。

8、在上述智能语音鼠标的控制方法中，对所述实时语音噪声特征和所述场景化数据库进行匹配分析以得到匹配结果，包括：从所述场景化数据库提取备选的噪声特征；对所述备选的噪声特征和所述实时语音噪声特征进行关联编码以得到备选噪声特征-实时语义特征关联矩阵；对所述备选噪声特征-实时语义特征关联矩阵进行位置敏感性的分布响应堆叠优化以得到优化备选噪声特征-实时语义特征关联矩阵；以及，基于所述优化备选噪声特征-实时语义特征关联矩阵，确定所述匹配结果。

9、在上述智能语音鼠标的控制方法中，对所述备选噪声特征-实时语义特征关联矩阵进行位置敏感性的分布响应堆叠优化以得到优化备选噪声特征-实时语义特征关联矩阵，包括：使用位置感性函数来确定所述备选噪声特征-实时语义特征关联矩阵中各个位置的位置感性值以得到位置感性特征矩阵；将所述备选噪声特征-实时语义特征关联矩阵和所述位置感性特征矩阵分别展开为备选噪声特征-实时语义特征关联向量和位置感性特征向量；使用分布响应堆叠优化公式对所述备选噪声特征-实时语义特征关联向量和所述位置感性特征向量进行处理以得到优化备选噪声特征-实时语义特征关联向量；以及，将所述优化备选噪声特征-实时语义特征关联向量进行维度重构以得到所述优化备选噪声特征-实时语义特征关联矩阵。

10、在上述智能语音鼠标的控制方法中，所述位置感性函数为：，表示所述备选噪声特征-实时语义特征关联矩阵中的各个位置，表示所述备选噪声特征-实时语义特征关联矩阵中各个位置的位置感性值，表示正弦函数。

11、在上述智能语音鼠标的控制方法中，使用位置感性函数来确定所述备选噪声特征-实时语义特征关联矩阵中各个位置的位置感性值以得到位置感性特征矩阵，包括：创建容器镜像；使用core container机制将所述容器镜像部署到目标环境；以及，使用 corecontainer 工具管理所述容器镜像，包括：启动、停止、更新和扩展。

12、在上述智能语音鼠标的控制方法中，所述分布响应堆叠优化公式为：

13、

14、其中，和分别表示所述备选噪声特征-实时语义特征关联向量和所述位置感性特征向量，为向量的范数的平方，为超参数，表示所述优化备选噪声特征-实时语义特征关联向量。

15、在上述智能语音鼠标的控制方法中，对所述降噪后语音数据进行语音识别以得到实时语音识别结果，包括：提取所述降噪后语音数据的mfcc特征；以及，将所述降噪后语音数据的mfcc特征输入预训练好的语音识别模型以得到所述实时语音识别结果。

16、在上述智能语音鼠标的控制方法中，基于所述实时语音识别结果，生成控制指令，包括：对所述实时语音识别结果进行语义理解以得到语音识别结果语义信息；以及，基于所述语音识别结果语义信息，生成所述控制指令。

17、根据本申请的另一方面，提供了一种智能语音鼠标，其包括：

18、场景化数据库构建模块，用于构建场景化数据库，其中，所述场景化数据库包括噪声特征和与所述噪声特征对应的参考噪声信号分量；

19、实时语音场景降噪模块，用于基于所述场景化数据库，对实时语音数据进行场景降噪以得到降噪后语音数据；

20、实时语音识别模块，用于对所述降噪后语音数据进行语音识别以得到实时语音识别结果；

21、控制指令生成模块，用于基于所述实时语音识别结果，生成控制指令。

22、与现有技术相比，本申请提供的一种智能语音鼠标的控制方法及智能语音鼠标，其利用基于语音信号处理、语音识别和语义理解技术对实时语音数据进行处理。具体地，首先构建场景化数据库，然后基于所述场景化数据库对实时语音数据依次进行场景降噪和语音识别以得到实时语音识别结果，以此根据所述实时语音识别结果来智能地生成控制指令。通过这样的方式，能够显著提高用户语音识别的准确性，并可以根据用户的个人偏好和使用习惯进行定制，从而为用户提供个性化的智能语音鼠标使用体验，以提高用户的工作效率。

技术特征：

1.一种智能语音鼠标的控制方法，其特征在于，包括：

2.根据权利要求1所述的智能语音鼠标的控制方法，其特征在于，对所述实时语音噪声特征和所述场景化数据库进行匹配分析以得到匹配结果，包括：

3.根据权利要求2所述的智能语音鼠标的控制方法，其特征在于，对所述备选噪声特征-实时语义特征关联矩阵进行位置敏感性的分布响应堆叠优化以得到优化备选噪声特征-实时语义特征关联矩阵，包括：

4.根据权利要求3所述的智能语音鼠标的控制方法，其特征在于，所述位置感性函数为：，表示所述备选噪声特征-实时语义特征关联矩阵中的各个位置，表示所述备选噪声特征-实时语义特征关联矩阵中各个位置的位置感性值，表示正弦函数。

5.根据权利要求4所述的智能语音鼠标的控制方法，其特征在于，使用位置感性函数来确定所述备选噪声特征-实时语义特征关联矩阵中各个位置的位置感性值以得到位置感性特征矩阵，包括：

6.根据权利要求5所述的智能语音鼠标的控制方法，其特征在于，所述分布响应堆叠优化公式为：

7.根据权利要求6所述的智能语音鼠标的控制方法，其特征在于，对所述降噪后语音数据进行语音识别以得到实时语音识别结果，包括：

8.根据权利要求7所述的智能语音鼠标的控制方法，其特征在于，基于所述实时语音识别结果，生成控制指令，包括：

9.一种智能语音鼠标，其特征在于，包括：

技术总结本申请公开了一种智能语音鼠标的控制方法及智能语音鼠标，其利用基于语音信号处理、语音识别和语义理解技术对实时语音数据进行处理。具体地，首先构建场景化数据库，然后基于所述场景化数据库对实时语音数据依次进行场景降噪和语音识别以得到实时语音识别结果，以此根据所述实时语音识别结果来智能地生成控制指令。通过这样的方式，能够显著提高用户语音识别的准确性，并可以根据用户的个人偏好和使用习惯进行定制，从而为用户提供个性化的智能语音鼠标使用体验，以提高用户的工作效率。技术研发人员：陈孝军,沈国良,刘立鑫,席俊武,景奕昕受保护的技术使用者：武汉攀升鼎承科技有限公司技术研发日：技术公布日：2024/5/29