技术新讯 > 乐器声学设备的制造及制作,分析技术 > 全时免唤醒误触发识别方法、装置、系统及存储介质与流程 > 正文

全时免唤醒误触发识别方法、装置、系统及存储介质与流程

国知局
2024-06-21 11:47:40

本技术属于语音识别，尤其涉及一种全时免唤醒误触发识别方法、装置、系统及存储介质。

背景技术：

1、目前现有的优化全时免唤醒误触发通常有两种方法，其中一种为提高识别结果的置信度来避免误触发，另一种为提高语义结果的置信度来避免误触发。

2、提高识别结果的置信度来避免误触发是在拿到识别结果时，判断识别结果的置信度，如果识别结果置信度低于设置的值则认为本次识别结果不可信，需要丢弃本次结果，从而实现避免误触发；提高语义结果的置信度来避免误触发是在拿到语义结果时，判断语义结果的置信度，如果语义结果置信度低于设置的值则认为本次语义结果不可信，需要丢弃本次结果，从而实现避免误触发。

3、但以上两种方法有一个共同的缺陷是识别结果置信度与语义结果置信度为各自独立的判断方式，通过各自的置信度判断来丢弃结果容易导致应该被触发的说法也被丢弃，识别与语义各自相互独立，在各自的置信度做判断并且互相不干扰，这种独立判断校验的方式无法实现将两种判断做一个相互补充的关系，从而没办法实现避免误触发与避免丢触发同时兼备。

技术实现思路

1、本技术的目的，在于提供一种全时免唤醒误触发识别方法、装置、系统及存储介质，根据语音识别结果调整当前的识别模式，结合当前的识别模式和根据语义结果得到的语义置信度，判断得到识别结果，实现避免误触发与避免丢触发的同时兼备。

2、为了达成上述目的，本技术的解决方案是：

3、第一方面，本技术实施例提供一种全时免唤醒误触发识别方法，包括：

4、获取语音识别结果，语音识别结果包括第一语音识别结果和第二语音识别结果，第二语音识别结果为第一语音识别结果上一次的语音识别结果；

5、在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式，识别模式包括奖励模式、惩罚模式和常规模式；

6、对语音识别结果进行处理，得到语义结果，并根据语义结果，得到语义置信度；

7、不同的识别模式对应不同的语义置信度的判断阈值，惩罚模式对应的语义置信度的判断阈值为第一阈值θ1，常规模式对应的语义置信度的判断阈值为第二阈值θ2，奖励模式对应的语义置信度的判断阈值为第三阈值θ3，其中θ1>θ2>θ3；

8、根据当前的识别模式对语义置信度进行判断，得到识别结果。

9、根据本技术实施例的上述方法，还可以具有以下附加技术特征：

10、进一步的，在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式，包括：

11、若在预设时间内，判断第一语音识别结果与第二语音识别结果相同，则调整当前的识别模式为奖励模式。

12、进一步的，在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式，包括：

13、若在预设时间内，判断第一语音识别结果与第二语音识别结果不同，则基于第一语音识别结果，得到识别置信度，根据识别置信度与预设阈值的关系，调整当前的识别模式。

14、进一步的，根据识别置信度与预设阈值的关系，调整当前的识别模式，包括：

15、若识别置信度小于预设阈值，则增加一次拒识数组的数量，并丢弃第一语音识别结果；

16、若在预设时间内，拒识数组的数量增加超过三次，则调整当前的识别模式为惩罚模式。

17、进一步的，根据当前的识别模式对语义置信度进行判断，得到识别结果，包括：

18、判断当前的识别模式是否为奖励模式，若当前的识别模式为奖励模式，则判断语义置信度是否大于第三阈值θ3；

19、若语义置信度大于第三阈值θ3，则识别结果为响应唤醒消息；

20、若语义置信度小于第三阈值θ3，则识别结果为丢弃结果。

21、进一步的，根据当前的识别模式对语义置信度进行判断，得到识别结果，包括：

22、若当前的识别模式不为奖励模式，则判断当前的识别模式是否为惩罚模式，若当前的识别模式为惩罚模式，则判断语义置信度是否大于第一阈值θ1；

23、若语义置信度大于第一阈值θ1，则识别结果为响应唤醒消息；

24、若语义置信度小于第一阈值θ1，则识别结果为丢弃结果。

25、进一步的，根据当前的识别模式对语义置信度进行判断，得到识别结果，包括：

26、若当前的识别模式既不是奖励模式，也不是惩罚模式，则判断当前的识别模式为常规模式，判断语义置信度是否大于第二阈值θ2；

27、若语义置信度大于第二阈值θ2，则识别结果为响应唤醒消息；

28、若语义置信度小于第二阈值θ2，则识别结果为丢弃结果。

29、第二方面，本技术实施例提供一种全时免唤醒误触发识别装置，包括：

30、数据获取模块，被配置为用于获取语音识别结果，语音识别结果包括第一语音识别结果和第二语音识别结果，第二语音识别结果为第一语音识别结果上一次的语音识别结果；

31、模式调整模块，被配置为用于在预设时间内对第一语音识别结果与第二语音识别结果进行判断，得到判断结果，根据判断结果调整当前的识别模式，识别模式包括奖励模式、惩罚模式和常规模式；

32、语义理解模块，被配置为用于对语音识别结果进行处理，得到语义结果，并根据语义结果，得到语义置信度；

33、不同的识别模式对应不同的语义置信度的判断阈值，惩罚模式对应的语义置信度的判断阈值为第一阈值θ1，常规模式对应的语义置信度的判断阈值为第二阈值θ2，奖励模式对应的语义置信度的判断阈值为第三阈值θ3，其中θ1>θ2>θ3；

34、结果识别模块，被配置为用于根据当前的识别模式对语义置信度进行判断，得到识别结果。

35、第三方面，本技术实施例提供了一种全时免唤醒误触发识别系统，系统包括处理器和存储器，存储器中存储有计算机程序，计算机程序由处理器加载并执行，以实现如本技术实施例第一方面提供的全时免唤醒误触发识别方法。

36、第四方面，本技术实施例提供了一种计算机可读存储介质，存储介质中存储有计算机程序，计算机程序被处理器执行时，用于实现如本技术实施例第一方面的全时免唤醒误触发识别方法。

37、采用本技术实施例提供的全时免唤醒误触发识别方法，与现有技术相比，具有如下有益技术效果：

38、本技术实施例通过在预设时间内对第一语音识别结果与第二语音识别结果进行判断，并根据判断结果调整当前的识别模式，可以实现模式的自适应，能够根据用户的交互行为和语音输入的变化来灵活调整识别模式，提高了识别的适应性和性能；

39、通过在预设时间内对语音识别结果进行判断，能够在实时性要求较高的场景中作出及时的调整，对于需要快速响应用户输入的应用场景(如语音助手、语音控制等)是非常重要的；

40、不同的识别模式对应不同的语义置信度判断阈值，能够根据当前模式对语义结果的准确性要求进行调整，在奖励模式下更注重提高准确性，而在惩罚模式下更注重快速响应，从而优化了语音识别的效果；设定不同模式对应的语义置信度判断阈值，能够更加智能地对语义结果进行判断；不同模式下，系统对于语义置信度的要求有所不同，能够在不同情境下实现更合理的语义理解和处理；通过在奖励模式下对高置信度语义结果的响应，能够提高用户体验，更有信心地响应用户的输入，而在惩罚模式下，能够更灵活地处理低置信度的语义结果，防止因置信度不足导致的误操作，实现避免误触发与避免丢触发的同时兼备。