技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音唤醒方法、装置、设备及存储介质与流程 > 正文

语音唤醒方法、装置、设备及存储介质与流程

国知局
2024-06-21 11:26:16

本发明涉及语音云应用，尤其涉及一种语音唤醒方法、装置、设备及存储介质。

背景技术：

1、随着语音智能识别技术的不断发展，人工智能唤醒的应用越来越广泛。例如，智能音箱、智能电视、智能汽车等，都渐渐地可以通过人工智能进行唤醒。现在主要的唤醒方式还是通过唤醒词的方式，例如，为智能家电设置唤醒词“小爱同学”，设备实时监听外界的声音，如果识别到外界有“小爱同学”这种语音数据的输入，那么就唤醒对应设备，即通过唤醒词实现对设备的唤醒。

2、目前，在需要进行语音唤醒的设备中，集成了语音识别芯片、拾音器和降噪器等设备，利用集成的语音识别芯片进行长待机唤醒词识别，再通过网络连接远程服务器进行更复杂的语音识别。但由于语音识别需要兼容各类人群的不同语调、不同音色、不同口音和环境背景声音等因素，原有的语音唤醒设备容易出现误唤醒的现象，一旦识别到语音波动，将提交至远程服务器，导致服务器资源利用率低。

3、上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

1、本发明的主要目的在于提供了一种语音唤醒方法、装置、设备及存储介质，旨在解决现有技术语音唤醒设备容易出现误唤醒的现象，导致服务器资源利用率低的技术问题。

2、获取待处理音频的音频波动曲线；

3、将所述待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较；

4、根据比较结果判断是否将所述待处理音频发送至服务器，以使所述服务器根据所述待处理音频进行语音唤醒。

5、可选地，所述将所述待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较的步骤，包括：

6、基于预设范围对唤醒音频的音频波动曲线进行移动处理，将移动覆盖区域作为唤醒音频波动曲线域；

7、将所述待处理音频的音频波动曲线与所述唤醒音频波动曲线域进行比较。

8、可选地，所述将所述待处理音频的音频波动曲线与所述唤醒音频波动曲线域进行比较的步骤，包括：

9、根据预设背景音频基准线对所述待处理音频的音频波动曲线进行调整，生成目标音频波动曲线；

10、将所述目标音频波动曲线与所述唤醒音频波动曲线域进行比较。

11、可选地，所述比较结果为：唤醒重合度；

12、所述将所述目标音频波动曲线与所述唤醒音频波动曲线域进行比较的步骤，包括：

13、确定所述目标音频波动曲线中在所述唤醒音频波动曲线域范围内的重合时长；

14、根据所述重合时长与所述唤醒音频的音频时长确定唤醒重合度。

15、可选地，所述将所述待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较的步骤之前，包括：

16、对预设个数测试对象进行预设次数音频采集，获得唤醒音频集；

17、将所述唤醒音频集的音频波动曲线进行处理，获得唤醒音频波动曲线。

18、可选地，所述获取待处理音频的音频波动曲线的步骤，包括：

19、获取收音音频的音频波动曲线；

20、在所述收音音频的音频波动曲线超过预设背景音频基准线时，进行声音录制，获得待处理音频的音频波动曲线。

21、可选地，所述在所述收音音频的音频波动曲线超过预设背景音频基准线时，进行声音录制，获得待处理音频的音频波动曲线的步骤，包括：

22、在所述收音音频的音频波动曲线超过预设背景音频基准线时，进行声音录制；

23、当进行声音录制时所述收音音频的音频波动曲线在预设时长内低于所述预设背景音频基准线时，结束声音录制，获得待处理音频的音频波动曲线。

24、此外，为实现上述目的，本发明还提出一种语音唤醒装置，所述装置包括：

25、收音模块，用于获取待处理音频的音频波动曲线；

26、比较模块，用于将所述待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较；

27、唤醒模块，用于根据比较结果判断是否将所述待处理音频发送至服务器，以使所述服务器根据所述待处理音频进行语音唤醒。

28、此外，为实现上述目的，本发明还提出一种语音唤醒设备，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音唤醒程序，所述语音唤醒程序配置为实现如上文所述的语音唤醒方法的步骤。

29、此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有语音唤醒程序，所述语音唤醒程序被处理器执行时实现如上文所述的语音唤醒方法的步骤。

30、本发明通过获取待处理音频的音频波动曲线；将所述待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较；根据比较结果判断是否将所述待处理音频发送至服务器，以使所述服务器根据所述待处理音频进行语音唤醒。由于本发明通过将获取的待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较，根据比较结果判断是否将待处理音频发送至服务器实现语音唤醒，从而解决了现有技术语音唤醒设备容易出现误唤醒的现象，导致设备语音唤醒的正确率低的技术问题，进而提高了服务器资源的利用率。

技术特征：

1.一种语音唤醒方法，其特征在于，所述方法包括：

2.如权利要求1所述的语音唤醒方法，其特征在于，所述将所述待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较的步骤，包括：

3.如权利要求2所述的语音唤醒方法，其特征在于，所述将所述待处理音频的音频波动曲线与所述唤醒音频波动曲线域进行比较的步骤，包括：

4.如权利要求3所述的语音唤醒方法，其特征在于，所述比较结果为：唤醒重合度；

5.如权利要求1所述的语音唤醒方法，其特征在于，所述将所述待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较的步骤之前，包括：

6.如权利要求1所述的语音唤醒方法，其特征在于，所述获取待处理音频的音频波动曲线的步骤，包括：

7.如权利要求6所述的语音唤醒方法，其特征在于，所述在所述收音音频的音频波动曲线超过预设背景音频基准线时，进行声音录制，获得待处理音频的音频波动曲线的步骤，包括：

8.一种语音唤醒装置，其特征在于，所述装置包括：

9.一种语音唤醒设备，其特征在于，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音唤醒程序，所述语音唤醒程序配置为实现如权利要求1至7中任一项所述的语音唤醒方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有语音唤醒程序，所述语音唤醒程序被处理器执行时实现如权利要求1至7任一项所述的语音唤醒方法的步骤。

技术总结本发明涉及语音云应用技术领域，公开了一种语音唤醒方法、装置、设备及存储介质，该方法通过获取待处理音频的音频波动曲线；将待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较；根据比较结果判断是否将待处理音频发送至服务器，以使服务器根据待处理音频进行语音唤醒。由于本发明通过将获取的待处理音频的音频波动曲线与唤醒音频的音频波动曲线进行比较，根据比较结果判断是否将待处理音频发送至服务器实现语音唤醒，从而解决了现有技术语音唤醒设备容易出现误唤醒的现象，导致设备语音唤醒正确率低的技术问题，进而提高了服务器资源的利用率。技术研发人员：汤恋,陈伟山,邓华芹受保护的技术使用者：深圳市创易联合科技有限公司技术研发日：技术公布日：2024/2/6