技术新讯 > 乐器声学设备的制造及制作,分析技术 > 电子设备、语音识别方法、装置及存储介质与流程 > 正文

电子设备、语音识别方法、装置及存储介质与流程

国知局
2024-06-21 11:41:37

本发明涉及语音识别，尤其涉及一种电子设备、语音识别方法、装置及存储介质。

背景技术：

1、随着语音识别技术的发展，语音交互的应用场景越来越普遍。例如，在智能电视、智能车载、智能家居、智能机器人等应用领域，用户可以通过电子设备提供的语音功能录入语音指令，使得电子设备对语音指令进行语义分析，以识别语音指令的操作意图，从而按照语音指令的操作意图控制电子设备执行相应的操作，如运行应用程序、搜索语音指令对应的内容等。

2、然而，由于语言种类的多样性，各个地区的方言不尽相同，比如对于一些不同的字，其发音可能相同，如“yue bing”，其对应的字有“阅兵”、“月饼”。在进行识别时，有时候会将相同发音的字识别为错误的字或词，因此，语音识别的准确率有待提高。

技术实现思路

1、本发明实施例提供一种电子设备、语音识别方法、装置及存储介质，用于解决现有技术中语音识别准确率不高的问题。

2、为达到上述目的，本技术的实施例采用如下技术方案：

3、根据本发明实施例的一个方面，提供了一种电子设备，包括：接收器，被配置为接收用户输入的语音指令；与所述接收器耦接的控制器，所述控制器被配置为：响应于所述语音指令，对所述语音指令进行识别，得到所述语音指令对应的多个候选识别结果；确定所述候选识别结果对应的实体数量；在所述实体数量小于或等于数量阈值的情况下，利用场景决策模块对所述语音指令的场景信息进行分析，以在所述多个候选识别结果中确定所述语音指令的目标识别结果。

4、在一些实施例中，所述控制器还被配置为：在所述实体数量大于所述数量阈值的情况下，利用知识图谱数据库确定各所述候选识别结果中多个所述实体之间的关系；根据各所述候选识别结果中多个所述实体之间的关系，将所述多个候选识别结果中满足第一输出条件的候选识别结果确定为所述目标识别结果。

5、在一些实施例中，所述控制器还被配置为：若所述多个候选识别结果不满足所述第一输出条件，则利用所述场景决策模块对所述语音指令的场景信息进行分析，以在所述多个候选识别结果中确定所述语音指令的目标识别结果。

6、在一些实施例中，所述语音指令的场景信息包括第一场景信息、第二场景信息和第三场景信息中的至少一项，所述场景决策模块包括环境感知数据库、时空感知数据库、方言感知数据库中至少一项，所述控制器被配置为：将各所述候选识别结果与所述环境感知数据库中所述第一场景信息对应的信息库中的信息进行匹配，得到各所述候选识别结果的第一匹配结果，所述第一场景信息包括所述语音指令对应的设备信息和/或应用程序信息；和/或，将各所述候选识别结果与所述时空感知数据库中所述第二场景信息对应的信息库中的信息进行匹配，得到各所述候选识别结果的第二匹配结果，所述第二场景信息包括所述语音指令对应的时间信息和/或区域位置信息；和/或，将各所述候选识别结果与所述方言感知数据库中所述第三场景信息对应的信息库中的信息进行匹配，得到各所述候选识别结果的第三匹配结果，所述第三场景信息包括所述语音指令的方言信息；根据所述第一匹配结果、所述第二匹配结果和所述第三匹配结果中的至少一项，将所述多个候选识别结果中满足第二输出条件的候选识别结果确定为所述目标识别结果。

7、在一些实施例中，所述控制器还被配置为：在所述多个候选识别结果不满足所述第二输出条件的情况下，根据各所述候选识别结果的输出概率，将所述输出概率最大的候选识别结果确定为所述目标识别结果。

8、在一些实施例中，所述控制器还被配置为：确定所述多个候选识别结果中任意两个候选识别结果的输出概率差值；在多个所述输出概率差值中的最小输出概率差值大于差值阈值的情况下，将所述多个候选识别结果中输出概率最大的候选识别结果确定为所述目标识别结果；在多个所述输出概率差值中的最大输出概率差值小于或等于所述差值阈值的情况下，执行确定所述候选识别结果对应的实体数量，在所述实体数量小于或等于数量阈值的情况下，利用场景决策模块对所述语音指令的场景信息进行分析，以在所述多个候选识别结果中确定所述语音指令的目标识别结果。

9、在一些实施例中，所述控制器还被配置为：根据所述目标识别结果确定所述语音指令对应的操作意图，以执行所述操作意图对应的控制操作。

10、根据本发明实施例的另一个方面，提供了一种语音识别方法，应用于电子设备，所述方法包括：接收用户输入的语音指令；响应于所述语音指令，对所述语音指令进行识别，得到所述语音指令对应的多个候选识别结果；确定所述候选识别结果对应的实体数量；在所述实体数量小于或等于数量阈值的情况下，利用场景决策模块对所述语音指令的场景信息进行分析，以在所述多个候选识别结果中确定所述语音指令的目标识别结果。

11、在一些实施例中，所述方法还包括：在所述实体数量大于所述数量阈值的情况下，利用知识图谱数据库确定各所述候选识别结果中多个所述实体之间的关系；根据各所述候选识别结果中多个所述实体之间的关系，将所述多个候选识别结果中满足第一输出条件的候选识别结果确定为所述目标识别结果。

12、在一些实施例中，所述方法还包括：若所述多个候选识别结果不满足所述第一输出条件，则利用所述场景决策模块对所述语音指令的场景信息进行分析，以在所述多个候选识别结果中确定所述语音指令的目标识别结果。

13、在一些实施例中，所述语音指令的场景信息包括第一场景信息、第二场景信息和第三场景信息中的至少一项，所述场景决策模块包括环境感知数据库、时空感知数据库、方言感知数据库中至少一项，所述利用场景决策模块对所述语音指令的场景信息进行分析，以在所述多个候选识别结果中确定所述语音指令的目标识别结果，包括：将各所述候选识别结果与所述环境感知数据库中所述第一场景信息对应的信息库中的信息进行匹配，得到各所述候选识别结果的第一匹配结果，所述第一场景信息包括所述语音指令对应的设备信息和/或应用程序信息；和/或，将各所述候选识别结果与所述时空感知数据库中所述第二场景信息对应的信息库中的信息进行匹配，得到各所述候选识别结果的第二匹配结果，所述第二场景信息包括所述语音指令对应的时间信息和/或区域位置信息；和/或，将各所述候选识别结果与所述方言感知数据库中所述第三场景信息对应的信息库中的信息进行匹配，得到各所述候选识别结果的第三匹配结果，所述第三场景信息包括所述语音指令的方言信息；根据所述第一匹配结果、所述第二匹配结果和所述第三匹配结果中的至少一项，将所述多个候选识别结果中满足第二输出条件的候选识别结果确定为所述目标识别结果。

14、在一些实施例中，所述方法还包括：在所述多个候选识别结果不满足所述第二输出条件的情况下，根据各所述候选识别结果的输出概率，将所述输出概率最大的候选识别结果确定为所述目标识别结果。

15、在一些实施例中，所述方法还包括：确定所述多个候选识别结果中任意两个候选识别结果的输出概率差值；在多个所述输出概率差值中的最小输出概率差值大于差值阈值的情况下，将所述多个候选识别结果中输出概率最大的候选识别结果确定为所述目标识别结果；在多个所述输出概率差值中的最大输出概率差值小于或等于所述差值阈值的情况下，执行确定所述候选识别结果对应的实体数量，在所述实体数量小于或等于数量阈值的情况下，利用场景决策模块对所述语音指令的场景信息进行分析，以在所述多个候选识别结果中确定所述语音指令的目标识别结果。

16、在一些实施例中，所述方法还包括：根据所述目标识别结果确定所述语音指令对应的操作意图，以执行所述操作意图对应的控制操作。

17、根据本发明实施例的又一个方面，提供了一种语音识别装置，应用于电子设备，所述装置包括：接收模块，用于接收用户输入的语音指令；第一识别模块，用于响应于所述语音指令，对所述语音指令进行识别，得到所述语音指令对应的多个候选识别结果；确定模块，用于确定所述候选识别结果对应的实体数量；第二识别模块，用于在所述实体数量小于或等于数量阈值的情况下，利用场景决策模块对所述语音指令的场景信息进行分析，以在所述多个候选识别结果中确定所述语音指令的目标识别结果。

18、根据本发明实施例的又一个方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令在显示设备上运行时，使得显示设备执行如上所述的语音识别方法的操作。

19、根据本发明实施例提供的电子设备、语音识别方法、装置及存储介质，可以响应于用户输入的语音指令，对语音指令进行识别，得到语音指令对应的多个候选识别结果，确定候选识别结果对应的实体数量，在实体数量小于或等于数量阈值的情况下，利用场景决策模块对语音指令的场景信息进行分析，确定语音指令的目标识别结果。

20、应用本方案，可以在得到语音指令对应的多个候选识别结果，且候选识别结果的实体数量不大于数量阈值的情况下，利用场景决策模块对语音指令的场景信息进行分析，从而对各候选识别结果进行澄清和消歧，能够提高语音识别的准确率。