技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频数据的语义校验方法、装置、计算机设备和存储介质与流程 > 正文

音频数据的语义校验方法、装置、计算机设备和存储介质与流程

国知局
2024-06-21 11:42:48

本申请涉及音频处理，特别是涉及一种音频数据的语义校验方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术：

1、随着音频处理技术的发展，能够识别语音。在传统技术中，通过对音频数据提取频谱特征，再将频谱特征输入到预设语义集合的识别模型进行分类，能够计算出音频数据表征不同预设语义的概率，再按照不同预设语义的概率确定音频数据的语义。

2、然而，按照这种方式进行语义识别后，其识别结果直接基于阈值或神经网络模型进行的语音活动检测后，还会出现误报的情况，难以保证音频识别的准确性。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高音频识别准确度的音频数据的语义校验方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本申请提供了一种音频数据的语义校验方法。所述方法包括：对音频数据进行语义识别，得到所述音频数据对应的语义序列；

3、在所述语义序列中查找出满足预设语义条件的语义集合，根据所述语义集合选择所述音频数据中的多个片段；

4、识别各个所述片段的噪声校验信息；

5、根据各个所述片段的噪声校验信息，生成所述语义集合的噪声校验信息；

6、根据所述语义集合的噪声校验信息，对所述音频数据的语义进行校验。

7、在其中一个实施例中，所述多个片段包括语义符合所述预设语义条件的语音片段集合，所述语义集合的噪声校验信息包括所述语音片段集合的噪声校验信息；所述根据各个所述片段的噪声校验信息，生成所述语义集合的噪声校验信息，包括：

8、判断所述各个片段的噪声校验信息是否满足预设条件，在所述语音片段集合中选择满足所述预设条件的语音片段；

9、根据选择的语音片段和所述语音片段集合之间的差异信息，生成所述语音片段集合的噪声校验信息。

10、在其中一个实施例中，所述根据选择的语音片段和所述语音片段集合之间的差异信息，生成所述语音片段集合的噪声校验信息，包括：

11、计算所述选择的语音片段的数量和所述语音片段集合中的语音片段的数量之间的比值；

12、将所述比值作为所述语音片段集合的噪声校验信息；

13、所述根据所述语义集合的噪声校验信息，对所述音频数据的语义进行校验，包括：

14、判断所述比值是否位于预设阈值区间，根据判断结果对所述音频数据的语义进行校验。

15、在其中一个实施例中，所述多个片段包括关联片段集合，所述关联片段集合是与语音片段集合相关联的音频片段集合，所述语音片段集合由语义符合所述预设语义条件的语音片段组成；所述语义集合的噪声校验信息包括所述关联片段集合的噪声校验信息；所述根据各个所述片段的噪声校验信息，生成所述语义集合的噪声校验信息，包括：

16、根据所述关联片段集合中的各个片段的噪声校验信息，确定所述关联片段集合中的多个非语音片段；

17、基于所述多个非语音片段生成所述关联片段集合的噪声校验信息。

18、在其中一个实施例中，所述关联片段集合包括与所述语音片段集合相邻的第一关联片段集合与第二关联片段集合；所述基于所述多个非语音片段生成所述关联片段集合的噪声校验信息，包括：

19、将所述第一关联片段集合的非语音片段数量，以及所述第二关联片段集合的非语音片段数量，作为所述关联片段集合的噪声校验信息；

20、所述根据所述语义集合的噪声校验信息，对所述音频数据的语义进行校验，包括：

21、根据所述第一关联片段集合的非语音片段数量、所述第二关联片段集合的非语音片段数量和预设数量阈值，对所述音频数据的语义进行校验。

22、在其中一个实施例中，所述方法还包括：

23、在所述音频数据中选取与所述语音片段集合相邻的音频片段，得到相邻片段集合；

24、识别所述相邻片段集合中的各个片段的噪声校验信息；

25、分别将所述相邻片段集合中各个片段的噪声校验信息作为关联片段集合中的各个片段的噪声校验信息。

26、在其中一个实施例中，所述在所述语义序列中查找出满足预设语义条件的语义集合，包括：

27、在所述语义序列中查找命令词语义；

28、当查找的命令词语义相同，且所述查找的命令词语义的数量位于对应的范围时，将所述查找的命令词语义作为语义集合。

29、第二方面，本申请还提供了一种音频数据的语义校验装置。所述装置包括：

30、语义识别模块，用于对音频数据进行语义识别，得到所述音频数据对应的语义序列；

31、片段噪声识别模块，用于识别各个所述片段的噪声校验信息；

32、语义集合选择模块，用于在所述语义序列中查找出满足预设语义条件的语义集合，根据所述语义集合选择所述音频数据中的片段；

33、语音识别模块，用于根据各个所述片段的噪声校验信息，生成所述语义集合的噪声校验信息；

34、校验模块，用于根据所述语义集合的噪声校验信息，对所述音频数据的语义进行校验。

35、第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任意实施例中音频数据的语义校验的步骤。

36、第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意实施例中音频数据的语义校验的步骤。

37、第五方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述任意实施例中音频数据的语义校验的步骤。

38、上述音频数据的语义校验方法、装置、计算机设备、存储介质和计算机程序产品，在音频数据对应的语义序列中，查找出满足预设语义条件的语义集合，进行了语义方面的校验；再根据所述语义集合选择所述音频数据中的多个片段，将语义校验和噪声校验联系起来；进而识别各个片段的噪声校验信息，根据各个片段的噪声校验信息，生成所述语义集合的噪声校验信息，整合了多个角度的噪声校验信息，最后根据语义集合的噪声校验信息对所述音频数据的语义再次进行校验。由此，通过对音频数据的语义进行多次校验，能够提高音频数据进行语义识别的准确度，同时能够降低音频数据的语义识别的虚警率。

技术特征：

1.一种音频数据的语义校验方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述多个片段包括语义符合所述预设语义条件的语音片段集合，所述语义集合的噪声校验信息包括所述语音片段集合的噪声校验信息；所述根据各个所述片段的噪声校验信息，生成所述语义集合的噪声校验信息，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据选择的语音片段和所述语音片段集合之间的差异信息，生成所述语音片段集合的噪声校验信息，包括：

4.根据权利要求1所述的方法，其特征在于，所述多个片段包括关联片段集合，所述关联片段集合是与语音片段集合相关联的音频片段集合，所述语音片段集合由语义符合所述预设语义条件的语音片段组成；所述语义集合的噪声校验信息包括所述关联片段集合的噪声校验信息；所述根据各个所述片段的噪声校验信息，生成所述语义集合的噪声校验信息，包括：

5.根据权利要求4所述的方法，其特征在于，所述关联片段集合包括与所述语音片段集合相邻的第一关联片段集合与第二关联片段集合；所述基于所述多个非语音片段生成所述关联片段集合的噪声校验信息，包括：

6.根据权利要求4所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述在所述语义序列中查找出满足预设语义条件的语义集合，包括：

8.一种音频数据的语义校验装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

技术总结本申请涉及一种音频数据的语义校验方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：对音频数据进行语义识别，得到所述音频数据对应的语义序列；在所述语义序列中查找出满足预设语义条件的语义集合，根据所述语义集合选择所述音频数据中的多个片段；识别各个所述片段的噪声校验信息；根据各个所述片段的噪声校验信息，生成所述语义集合的噪声校验信息；根据所述语义集合的噪声校验信息，对所述音频数据的语义进行校验。采用本方法能够提高音频数据的语义识别的准确度，降低语义错误识别的可能性。技术研发人员：龙良曲,郭士嘉受保护的技术使用者：影石创新科技股份有限公司技术研发日：技术公布日：2024/4/17