技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种语音质检方法及装置、电子设备、存储介质与流程 > 正文

一种语音质检方法及装置、电子设备、存储介质与流程

国知局
2024-06-21 11:42:49

本公开涉及语音识别，具体而言，涉及一种语音质检方法及装置、电子设备、存储介质。

背景技术：

1、在网络销售或电话销售领域，公司的员工需要和顾客进行电话沟通，一些公司为了提高员工的工作效率，会设置全勤奖或最低通话时长，然而一些员工为了满足最低通话时长或者满足全勤奖要求，会出现作弊行为，比如：打电话给自己，或者在拨通电话后播放音乐等其他不相关内容，或者单纯挂通电话但无通话声音。

2、目前主要通过预训练语言模型(bidirectional encoder representation fromtransformers，bert)判断通话是否存在作弊行为，但通话长度往往在数十分钟，而bert模型文本长度输入有限，且bert模型需要调用图形处理器(graphics processing unit，gpu)，物力成本和时间成本均较高。

技术实现思路

1、针对上述情况，本申请实施例提供了一种语音质检方法及装置、电子设备、存储介质，旨在解决上述问题或者至少部分地解决上述问题。

2、第一方面，本申请实施例提供了一种语音质检方法，所述方法包括：获取目标语音数据；确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量；基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，检测所述目标语音数据是否符合预设规定。

3、在一些实施例中，所述确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，包括：基于语音识别技术对所述目标语音数据进行识别，生成目标文本；基于所述目标文本确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量。

4、在一些实施例中，所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，检测所述目标语音数据是否符合预设规定，包括：若所述目标语音数据的语速无异常，则基于所述目标语音数据的关键词含量，检测所述目标语音数据是否符合预设规定。

5、在一些实施例中，所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，检测所述目标语音数据是否符合预设规定，包括：若所述目标语音数据的语速异常，确定所述目标语音数据不符合预设规定。

6、在一些实施例中，基于以下方式确定所述目标语音数据的语速是否异常：若所述目标语音数据的语速小于语速阈值，则确定所述目标语音数据的语速异常；若所述目标语音数据的语速大于或等于所述语速阈值，则确定所述目标语音数据的语速无异常。

7、在一些实施例中，所述语速阈值基于正语音样本的语速和负语音样本的语速确定；其中，所述正语音样本表示合规语音，所述负语音样本表示不合规语音。

8、在一些实施例中，所述基于所述目标语音数据的关键词含量，确定所述目标语音数据是否符合预设规定，包括：若所述目标语音数据的关键词含量小于预设关键词含量，确定所述目标语音数据不符合预设规定；若所述目标语音数据的关键词含量大于或等于所述预设关键词含量，确定所述目标语音数据符合预设规定。

9、第二方面，本申请实施例还提供了一种语音质检装置，所述装置包括：

10、获取模块，用于获取目标语音数据；处理模块，用于确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量；检测模块，用于基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，检测所述目标语音数据是否符合预设规定。

11、在一些实施例中，处理模块，具体用于基于以下方式确定目标语音数据的语速和/或目标语音数据包含的关键词含量：基于语音识别技术对目标语音数据进行识别，生成目标文本；基于目标文本确定目标语音数据的语速和/或目标语音数据包含的关键词含量。

12、在一些实施例中，处理模块，具体用于基于以下方式确定目标语音数据的语速和/或目标语音数据包含的关键词含量：若目标语音数据的语速无异常，则基于目标语音数据的关键词含量，检测目标语音数据是否符合预设规定。

13、在一些实施例中，检测模块，具体用于基于以下方式检测目标语音数据是否符合预设规定：若目标语音数据的语速异常，确定目标语音数据不符合预设规定。

14、在一些实施例中，基于以下方式确定目标语音数据的语速是否异常：若目标语音数据的语速小于语速阈值，则确定目标语音数据的语速异常；若目标语音数据的语速大于或等于语速阈值，则确定目标语音数据的语速无异常。

15、在一些实施例中，语速阈值基于正语音样本的语速和负语音样本的语速确定；其中，正语音样本表示合规语音，负语音样本表示不合规语音。

16、在一些实施例中，检测模块，具体用于基于以下方式确定目标语音数据是否符合预设规定，包括：若目标语音数据的关键词含量小于预设关键词含量，确定目标语音数据不符合预设规定；若目标语音数据的关键词含量大于或等于预设关键词含量，确定目标语音数据符合预设规定。

17、第三方面，本申请实施例还提供了一种电子设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，可执行指令在被执行时使处理器执行上述第一方面的步骤。

18、第四方面，本申请实施例还提供了一种计算机可读存储介质，计算机可读存储介质存储一个或多个程序，一个或多个程序当被包括多个应用程序的电子设备执行时，使得电子设备执行上述第二方面的步骤。

19、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：本申请通过检测语音数据的语速，可识别单纯挂通的场景，通过检测语音数据的关键词含量，可以识别播放不相关录音的场景，从而查找出不合规行为。并且本申请的方案无需调用gpu，降低物力消耗和人力消耗。

技术特征：

1.一种语音质检方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，检测所述目标语音数据是否符合预设规定，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，检测所述目标语音数据是否符合预设规定，包括：

5.根据权利要求3或4所述的方法，其特征在于，基于以下方式确定所述目标语音数据的语速是否异常：

6.根据权利要求5所述的方法，其特征在于，所述语速阈值基于正语音样本的语速和负语音样本的语速确定；

7.根据权利要求3所述的方法，其特征在于，所述基于所述目标语音数据的关键词含量，确定所述目标语音数据是否符合预设规定，包括：

8.一种语音质检装置，其特征在于，所述装置包括：

9.一种电子设备，包括：

10.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行如权利要求1-7任一所述的语音质检方法的步骤。

技术总结本申请涉及语音识别技术领域，公开了一种语音质检方法及装置、电子设备、存储介质；其方法包括：获取目标语音数据；确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量；基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量，检测所述目标语音数据是否符合预设规定。本申请能够检测出不合规的通话，且无需调用GPU，降低物力消耗和人力消耗。技术研发人员：王月宝,沈鹏,黄明星,周晓波,陈辉亮,段彦夺受保护的技术使用者：北京水滴科技集团有限公司技术研发日：技术公布日：2024/4/17