技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音识别方法、装置、设备及可读存储介质与流程 > 正文

语音识别方法、装置、设备及可读存储介质与流程

国知局
2024-06-21 11:38:08

本技术涉及语音处理，更具体的说，是涉及一种语音识别方法、装置、设备及可读存储介质。

背景技术：

1、目前，虚拟助手越来越受欢迎，因此，高质量的语音识别对虚拟助手的应用起到了至关重要的作用。对于语音助手来说，通用词的识别准确率较高，识别错误往往集中在某些实体，例如“播放××的星晴”可能会识别成“播放××的心情”，因此，在语音识别时，如何提升实体识别正确率，成为本领域技术人员亟待解决的技术问题。

技术实现思路

1、鉴于上述问题，本技术提出了一种语音识别方法、装置、设备及可读存储介质。具体方案如下：

2、一种语音识别方法，所述方法包括：

3、确定候选语音识别结果；

4、针对每个候选语音识别结果，基于所述候选语音识别结果的实体相关性，以及，与预设实体库中实体的匹配结果，确定所述候选语音识别结果的最终得分，其中，与实体相关且与预设实体库中的实体匹配的候选语音识别结果的最终得分高于与实体不相关，或，与预设实体库中实体不匹配的候选语音识别结果的最终得分；

5、从各个候选语音识别结果中选取最终得分最高的，作为最终的语音识别结果。

6、可选地，所述确定候选语音识别结果，包括：

7、获取语音识别模型的解码结果；

8、基于所述语音识别模型的解码结果，确定所述候选语音识别结果。

9、可选地，所述基于所述语音识别模型的解码结果，确定所述候选语音识别结果，包括：

10、将所述语音识别模型的解码结果，确定为所述候选语音识别结果。

11、可选地，所述基于所述语音识别模型的解码结果，确定所述候选语音识别结果，包括：

12、从所述语音识别模型的解码结果中确定目标解码结果，所述目标解码结果为所述语音识别模型的解码结果中与预设说法模板匹配的解码结果；

13、从预设实体库中确定目标实体，所述目标实体为所述预设实体库中与所述目标解码结果中实体的相似度满足预设条件的实体；

14、基于所述预设说法模板，以及所述目标实体，生成扩展解码结果；

15、基于所述语音识别模型的解码结果，以及，所述扩展解码结果，确定为所述候选语音识别结果。

16、可选地，所述说法模板中包含一个或多个语义槽，每个语义槽对应一个实体，则所述基于所述预设说法模板，以及所述目标实体，生成扩展解码结果，包括：

17、将所述目标实体填充至所述预设说法模板中的语义槽内，生成扩展解码结果。

18、可选地，所述基于所述候选语音识别结果的实体相关性，以及，与预设实体库中实体的匹配结果，确定所述候选语音识别结果的最终得分，包括：

19、确定所述候选语音识别结果的初始得分；

20、基于所述候选语音识别结果的实体相关性，以及，与预设实体库中实体的匹配结果，将所述候选语音识别结果的初始得分确定为所述候选语音识别结果的最终得分，或对所述候选语音识别结果的初始得分进行激励，确定所述候选语音识别结果的最终得分，或对所述候选语音识别结果的初始得分进行惩罚，确定所述候选语音识别结果的最终得分。

21、可选地，所述确定所述候选语音识别结果的初始得分，包括：

22、如果所述候选语音识别结果为所述语音识别模型的解码结果，则基于所述语音识别模型中的声学模型得分和语言模型得分，确定所述候选语音识别结果的初始得分；

23、如果所述候选语音识别结果为所述扩展解码结果，则基于所述目标实体的热度，和/或，所述目标实体与所述目标解码结果中实体的相似度，确定所述候选语音识别结果的初始得分。

24、可选地，所述候选语音识别结果的实体相关性的确定方式，包括：

25、判断所述候选语音识别结果对应的说法模板是否为预设说法模板库中的说法模板；

26、如果是，则确定所述候选语音识别结果与实体相关；

27、如果不是，则确定所述候选语音识别结果与实体无关。

28、一种语音识别装置，所述装置包括：

29、候选语音识别结果确定单元，用于确定候选语音识别结果；

30、最终得分确定单元，用于针对每个候选语音识别结果，基于所述候选语音识别结果的实体相关性，以及，与预设实体库中实体的匹配结果，确定所述候选语音识别结果的最终得分，其中，与实体相关且与预设实体库中的实体匹配的候选语音识别结果的最终得分高于与实体不相关，或，与预设实体库中实体不匹配的候选语音识别结果的最终得分；

31、选取单元，用于从各个候选语音识别结果中选取最终得分最高的，作为最终的语音识别结果。

32、可选地，所述候选语音识别结果确定单元，包括：

33、语音识别模型的解码结果获取单元，用于获取语音识别模型的解码结果；

34、候选语音识别结果确定子单元，用于基于所述语音识别模型的解码结果，确定所述候选语音识别结果。

35、可选地，所述候选语音识别结果确定子单元，包括：

36、第一候选语音识别结果确定子单元，用于将所述语音识别模型的解码结果，确定为所述候选语音识别结果。

37、可选地，所述候选语音识别结果确定子单元，包括：

38、目标解码结果确定子单元，用于从所述语音识别模型的解码结果中确定目标解码结果，所述目标解码结果为所述语音识别模型的解码结果中与预设说法模板匹配的解码结果；

39、目标实体确定子单元，用于从预设实体库中确定目标实体，所述目标实体为所述预设实体库中与所述目标解码结果中实体的相似度满足预设条件的实体；

40、扩展解码结果生成子单元，用于基于所述预设说法模板，以及所述目标实体，生成扩展解码结果；

41、第二候选语音识别结果确定子单元，用于基于所述语音识别模型的解码结果，以及，所述扩展解码结果，确定为所述候选语音识别结果。

42、可选地，所述说法模板中包含一个或多个语义槽，每个语义槽对应一个实体，则所述扩展解码结果生成子单元，具体用于：

43、将所述目标实体填充至所述预设说法模板中的语义槽内，生成扩展解码结果。

44、可选地，所述最终得分确定单元，包括：

45、初始得分确定单元，用于确定所述候选语音识别结果的初始得分；

46、初始得分处理单元，用于基于所述候选语音识别结果的实体相关性，以及，与预设实体库中实体的匹配结果，将所述候选语音识别结果的初始得分确定为所述候选语音识别结果的最终得分，或对所述候选语音识别结果的初始得分进行激励，确定所述候选语音识别结果的最终得分，或对所述候选语音识别结果的初始得分进行惩罚，确定所述候选语音识别结果的最终得分。

47、可选地，所述初始得分确定单元，具体用于：

48、如果所述候选语音识别结果为所述语音识别模型的解码结果，则基于所述语音识别模型中的声学模型得分和语言模型得分，确定所述候选语音识别结果的初始得分；

49、如果所述候选语音识别结果为所述扩展解码结果，则基于所述目标实体的热度，和/或，所述目标实体与所述目标解码结果中实体的相似度，确定所述候选语音识别结果的初始得分。

50、可选地，所述最终得分确定单元，具体用于：

51、判断所述候选语音识别结果对应的说法模板是否为预设说法模板库中的说法模板；

52、如果是，则确定所述候选语音识别结果与实体相关；

53、如果不是，则确定所述候选语音识别结果与实体无关。

54、一种语音识别设备，包括存储器和处理器；

55、所述存储器，用于存储程序；

56、所述处理器，用于执行所述程序，实现如上所述的语音识别方法的各个步骤。

57、一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上所述的语音识别方法的各个步骤。

58、借由上述技术方案，本技术公开了一种语音识别方法、装置、设备及可读存储介质。该方案中，在确定候选语音识别结果之后，针对每个候选语音识别结果，基于候选语音识别结果的实体相关性，以及，与预设实体库中实体的匹配结果，确定候选语音识别结果的最终得分，最后从各个候选语音识别结果中选取最终得分最高的，作为最终的语音识别结果。考虑到与实体相关，以及，与预设实体库中实体匹配的候选语音识别结果，实体识别正确的概率更高，将该种候选语音识别结果的最终得分设置的高一些，使得这种候选语音识别结果具有更高的概率被选作为最终的语音识别结果，从而提升了语音识别结果的实体识别正确率。