技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种语音唤醒方法及系统、用电设备与流程 > 正文

一种语音唤醒方法及系统、用电设备与流程

国知局
2024-06-21 10:41:52

本发明涉及语音唤醒方案设计，具体涉及一种语音唤醒方法及系统、用电设备。

背景技术：

1、现有的语音唤醒控制系统通常采用固定的语音唤醒阈值来判断是否唤醒设备。这个固定阈值是通过权衡误唤醒率和唤醒率得出的结果。误唤醒是指在非预期情况下被错误地唤醒，而唤醒率是指语音指令成功唤醒设备的比率。

2、然而，固定阈值的使用在一定程度上影响了用户的实际体验。当设置较低的阈值时，唤醒率可能会增加，但同时也会导致误唤醒的频率增加，用户的隐私和安全性可能受到威胁。而当设置较高的阈值时，可以减少误唤醒的发生，但也会降低唤醒率，导致用户的使用体验下降。

3、因此，现有技术中的固定阈值无法满足不同环境和使用场景的需求。为了改善用户体验，需要一种能够动态调整语音唤醒阈值的方法。

4、因此，现有技术还有待进一步发展。

技术实现思路

1、本发明的目的在于克服上述技术不足，提供一种语音唤醒方法及系统、用电设备，以解决现有技术存在的固定阈值无法满足不同环境和使用场景的需求的问题。

2、为达到上述技术目的，根据本发明的第一方面，本发明提供了一种语音唤醒方法，所述方法包括：

3、s1、获取用户语音交互信号的信号发出时间数据和信号发出位置数据；

4、s2、根据所述信号发出时间数据和信号发出位置数据，利用聚类算法计算用户的习惯唤醒时间段和习惯唤醒区域，并统计在不同习惯唤醒时间段内不同习惯唤醒区域的唤醒频率；

5、s3、任一习惯唤醒时间段内，根据对应习惯唤醒区域的唤醒频率，调整该位置区域的出厂默认唤醒阈值。

6、具体的，所述根据所述信号发出时间数据和信号发出位置数据，利用聚类算法计算用户的习惯唤醒时间段和习惯唤醒区域，并统计在不同习惯唤醒时间段内不同习惯唤醒区域的唤醒频率，具体为：

7、利用聚类算法对信号发出时间数据和信号发出位置数据进行聚类，获取多个习惯唤醒时间段和每个习惯唤醒时间段内，多个习惯唤醒区域，统计同一习惯唤醒时间段内各个习惯唤醒区域内的唤醒次数数据，利用聚类算法对同一习惯唤醒时间段内的所有唤醒次数数据进行聚类，得到由高到低的多个唤醒频率层级，同一习惯唤醒时间段内每个习惯唤醒区域均对应一个唤醒频率层级。

8、具体的，任一习惯唤醒时间段内，根据对应习惯唤醒区域的唤醒频率，调整该位置区域的出厂默认唤醒阈值，具体为：

9、根据每个习惯唤醒时间段内，各个习惯唤醒区域的唤醒频率层级，按照预设规则调整每个习惯唤醒时间段内，各个习惯唤醒区域的语音唤醒阈值；

10、所述预设规则包括：任意一个习惯唤醒区域在任意一个习惯唤醒时间段内的唤醒频率层级越高，该习惯唤醒区域在该习惯唤醒时间段内的语音唤醒阈值越低。

11、具体的，所述获取用户语音交互信号的信号发出时间数据和信号发出位置数据，具体为：

12、利用麦克风整列传感器采集用户语音交互信号以及用户语音交互信号到达麦克风阵列中不同麦克风之间的时间差和/或相位差，根据所述时间差和/或相位差，进行声源定位，得到信号发出位置数据，并利用计时器获取该用户语音交互信号到达计时器的时间戳数据，作为信号发出时间数据，控制模块利用语音识别模块对用户语音交互信号进行相似度打分，判断打分结果是否大于或等于语音唤醒阈值，若是，记录该用户语音交互信号的信号发出位置数据和信号发出时间数据。

13、具体的，所述利用聚类算法对信号发出时间数据和信号发出位置数据进行聚类，获取多个习惯唤醒时间段和每个习惯唤醒时间段内，多个习惯唤醒区域，具体为：

14、利用k-means算法对信号发出时间数据进行聚类，得到多个簇，将每个簇的信号发出时间数据的最小值和最大值作为一个习惯唤醒时间段。

15、具体的，所述利用聚类算法对信号发出时间数据和信号发出位置数据进行聚类，获取多个习惯唤醒时间段和每个习惯唤醒时间段内，多个习惯唤醒区域，具体为：

16、利用dbscan算法对信号发出时间数据进行聚类，得到多个簇，每个簇包含一组具有相似时间特征的信号发出时间数据；将每个簇的信号发出时间数据的最小值和最大值作为一个习惯唤醒时间段。

17、具体的，所述利用聚类算法对信号发出时间数据和信号发出位置数据进行聚类，获取多个习惯唤醒时间段和每个习惯唤醒时间段内，多个习惯唤醒区域，还包括：

18、利用k-means算法对每个习惯唤醒时间段内的信号发出位置数据进行聚类，得到多个簇，及，每个簇对应的聚类中心，所述聚类中心代表了每个簇的平均欧氏距离值；将每个簇中所有位于簇的边界的所有点进行连通，得到多个习惯唤醒区域。

19、具体的，所述利用聚类算法对信号发出时间数据和信号发出位置数据进行聚类，获取多个习惯唤醒时间段和每个习惯唤醒时间段内，多个习惯唤醒区域，还包括：

20、利用dbscan算法对每个习惯唤醒时间段内的信号发出位置数据进行聚类，得到多个簇，及，每个簇对应的核心对象，每个簇包含一组具有相似位置特征的信号发出位置数据；将每个簇中所有位于簇的边界的所有点进行连通，得到多个习惯唤醒区域。

21、具体的，所述利用聚类算法对同一习惯唤醒时间段内的所有唤醒次数数据进行聚类，得到由高到低的多个唤醒频率层级，还包括：

22、利用k-means算法对每个习惯唤醒时间段内的唤醒次数数据进行聚类，得到多个簇，及，每个簇对应的聚类中心，所述聚类中心代表了每个簇的平均唤醒次数数据；将每个簇按照其平均唤醒次数的高低，定义为由高到低的多个唤醒频率层级。

23、具体的，所述利用聚类算法对同一习惯唤醒时间段内的所有唤醒次数数据进行聚类，得到由高到低的多个唤醒频率层级，还包括：

24、利用dbscan算法对每个习惯唤醒时间段内的唤醒次数数据进行聚类，得到多个簇，每个簇包含一组具有相似数量特征的唤醒次数数据；计算每个簇的平均唤醒次数数据，将每个簇按照其平均唤醒次数的高低，定义为由高到低的多个唤醒频率层级。

25、根据本发明的第二方面，提供一种语音唤醒系统，包括：

26、获取模块，用于获取用户语音交互信号的信号发出时间数据和信号发出位置数据；

27、控制模块，用于获取用户语音交互信号的信号发出时间数据和信号发出位置数据；或用于根据所述信号发出时间数据和信号发出位置数据，利用聚类算法计算用户的习惯唤醒时间段和习惯唤醒区域，并统计在不同习惯唤醒时间段内不同习惯唤醒区域的唤醒频率；或用于在任一习惯唤醒时间段内，根据对应习惯唤醒区域的唤醒频率，调整该位置区域的出厂默认唤醒阈值。

28、根据本发明的第三方面，提供一种用电设备，包括：存储器；以及处理器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现上述的语音唤醒方法。

29、有益效果：

30、本发明针对现有技术中固定阈值无法满足不同环境和使用场景的需求的问题，本发明提供了一种基于时间和区域决策的动态语音唤醒控制方法。通过收集用户的语音唤醒位置和时间数据，并进行数据处理和分析，可以根据不同区域的唤醒频率情况动态调整语音唤醒阈值，提高用户体验。