技术新讯 > 乐器声学设备的制造及制作,分析技术 > 交互音频的识别方法及装置、设备、存储介质与流程 > 正文

交互音频的识别方法及装置、设备、存储介质与流程

国知局
2024-06-21 11:29:57

本申请实施例涉及音频处理技术，涉及但不限于一种交互音频的识别方法及装置、设备、存储介质。

背景技术：

1、在人工智能工作的过程中，通常会根据用户说话的交互音频来确定是否需要进行回答。

2、相关技术中，通常是基于无效拒识服务来直接确定出识别结果，并基于该识别结果来确定是否需要进行回答。

3、然而，由于可能存在杂音或者其他外界影响因素等的影响，使得基于无效拒识服务无法快速地得到识别结果，从而使得人工智能不能及时确定出是否需要进行回答，导致了输出结果的速度较慢、效率较低。

技术实现思路

1、有鉴于此，本申请实施例提供的交互音频的识别方法及装置、设备、存储介质，能够令终端设备更加快速、高效地输出结果。本申请实施例提供的交互音频的识别方法及装置、设备、存储介质是这样实现的：

2、本申请实施例提供的一种交互音频的识别方法，该方法应用于终端设备，该方法包括：

3、获取交互音频；

4、基于音频识别服务系统中的音频识别服务，确定交互音频的识别结果，音频识别服务系统中至少包括无效拒识服务以及文本处理服务，文本处理服务的处理效率高于无效拒识服务的处理效率，识别结果包括有效交互以及无效交互；

5、当文本处理服务的识别结果为有效交互的情况下，将交互音频的识别结果确定为有效交互。

6、本申请实施例提供的交互音频的识别装置，该装置应用于终端设备，该装置包括：获取模块，识别模块；

7、获取模块，用于获取交互音频；

8、识别模块，用于基于音频识别服务系统中的音频识别服务，确定交互音频的识别结果，音频识别服务系统中至少包括无效拒识服务以及文本处理服务，文本处理服务的处理效率高于无效拒识服务的处理效率，识别结果包括有效交互以及无效交互；

9、当文本处理服务的识别结果为有效交互的情况下，将交互音频的识别结果确定为有效交互。

10、本申请实施例提供的计算机设备，包括存储器和处理器，存储器存储有可在处理器上运行的计算机程序，处理器执行程序时实现本申请实施例的方法。

11、本申请实施例提供的计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现本申请实施例提供的方法。

12、本申请实施例所提供的交互音频的识别方法、装置、计算机设备和计算机可读存储介质，可以基于音频识别服务系统中的音频识别服务，确定交互音频的识别结果，由于文本处理服务的处理效率高于无效拒识服务的处理效率，可以在文本处理服务的识别结果为有效交互的情况下，确定交互音频的识别结果为有效交互，相较于仅仅使用无效拒识服务确定交互音频的识别结果，可以更加快速、高效地得到交互音频的识别结果，并且，基于文本处理服务也可以保证该识别结果的准确性较高并且减少算力的消耗，也即是可以令终端设备更加及时地输出该交互音频的识别结果。

技术特征：

1.一种交互音频的识别方法，其特征在于，所述方法应用于终端设备，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于音频识别服务系统中的音频识别服务，确定所述交互音频的识别结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述文本处理服务包括高频词汇匹配服务，所述高频词汇匹配服务用于根据所述交互音频中存在的词汇在高频词汇表中的命中情况确定识别结果，当所述交互音频中存在命中所述高频词汇表的词汇的情况下，确定所述高频词汇匹配服务的识别结果为有效交互；当所述交互音频中不存在命中所述高频词汇表的词汇的情况下，确定所述高频词汇匹配服务的识别结果不是有效交互。

4.根据权利要求1所述的方法，其特征在于，所述基于音频识别服务系统中的音频识别服务，确定所述交互音频的识别结果，包括：

5.根据权利要求4所述的方法，其特征在于，所述文本处理服务包括低频词汇匹配服务，所述低频词汇匹配服务用于根据所述交互音频中存在的词汇在低频词汇表中的命中情况确定识别结果，当所述交互音频中所有的词汇均命中所述低频词汇表的词汇的情况下，确定所述低频词汇匹配服务的识别结果为无效交互；当所述交互音频中存在未命中所述低频词汇表的词汇的情况下，确定所述高频词汇匹配服务的识别结果不是无效交互。

6.根据权利要求1所述的方法，其特征在于，所述基于音频识别服务系统中的音频识别服务，确定所述交互音频的识别结果，包括：

7.根据权利要求6所述的方法，其特征在于，所述基于在预设时长内是否获取到所述无效拒识服务的识别结果确定所述交互音频的识别结果，包括：

8.根据权利要求7所述的方法，其特征在于，所述根据所述文本处理服务的识别结果确定所述交互音频的识别结果，包括：

9.根据权利要求1-8中任一项所述的方法，其特征在于，所述音频识别服务系统还包括对话管理服务，所述方法还包括：

10.根据权利要求1-8中任一项所述的方法，其特征在于，所述音频识别服务系统还包括对话管理服务，所述方法还包括：

11.根据权利要求1-8中任一项所述的方法，其特征在于，所述音频识别服务系统还包括对话管理服务，所述方法还包括：

12.根据权利要求1-8中任一项所述的方法，其特征在于，所述音频识别服务系统还包括对话管理服务，所述方法还包括：

13.根据权利要求1-8中任一项所述的方法，其特征在于，基于所述无效拒识服务确定识别结果，包括：

14.一种交互音频的识别装置，其特征在于，所述装置应用于终端设备，所述装置包括：获取模块，识别模块；

15.一种计算机设备，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至13任一项所述方法的步骤。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1至13任一项所述的方法。

技术总结本申请实施例公开了一种交互音频的识别方法及装置、设备、存储介质，该方法包括：获取交互音频；基于音频识别服务系统中的音频识别服务，确定交互音频的识别结果，音频识别服务系统中至少包括无效拒识服务以及文本处理服务，文本处理服务的处理效率高于无效拒识服务的处理效率，识别结果包括有效交互以及无效交互；当文本处理服务的识别结果为有效交互的情况下，将交互音频的识别结果确定为有效交互。能够令终端设备更加快速、高效地输出结果。技术研发人员：解传栋受保护的技术使用者：OPPO广东移动通信有限公司技术研发日：技术公布日：2024/2/21