一种语音质检方法及装置、电子设备、存储介质与流程
- 国知局
- 2024-06-21 11:42:49
本公开涉及语音识别,具体而言,涉及一种语音质检方法及装置、电子设备、存储介质。
背景技术:
1、在网络销售或电话销售领域,公司的员工需要和顾客进行电话沟通,一些公司为了提高员工的工作效率,会设置全勤奖或最低通话时长,然而一些员工为了满足最低通话时长或者满足全勤奖要求,会出现作弊行为,比如:打电话给自己,或者在拨通电话后播放音乐等其他不相关内容,或者单纯挂通电话但无通话声音。
2、目前主要通过预训练语言模型(bidirectional encoder representation fromtransformers,bert)判断通话是否存在作弊行为,但通话长度往往在数十分钟,而bert模型文本长度输入有限,且bert模型需要调用图形处理器(graphics processing unit,gpu),物力成本和时间成本均较高。
技术实现思路
1、针对上述情况,本申请实施例提供了一种语音质检方法及装置、电子设备、存储介质,旨在解决上述问题或者至少部分地解决上述问题。
2、第一方面,本申请实施例提供了一种语音质检方法,所述方法包括:获取目标语音数据;确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量;基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定。
3、在一些实施例中,所述确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,包括:基于语音识别技术对所述目标语音数据进行识别,生成目标文本;基于所述目标文本确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量。
4、在一些实施例中,所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定,包括:若所述目标语音数据的语速无异常,则基于所述目标语音数据的关键词含量,检测所述目标语音数据是否符合预设规定。
5、在一些实施例中,所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定,包括:若所述目标语音数据的语速异常,确定所述目标语音数据不符合预设规定。
6、在一些实施例中,基于以下方式确定所述目标语音数据的语速是否异常:若所述目标语音数据的语速小于语速阈值,则确定所述目标语音数据的语速异常;若所述目标语音数据的语速大于或等于所述语速阈值,则确定所述目标语音数据的语速无异常。
7、在一些实施例中,所述语速阈值基于正语音样本的语速和负语音样本的语速确定;其中,所述正语音样本表示合规语音,所述负语音样本表示不合规语音。
8、在一些实施例中,所述基于所述目标语音数据的关键词含量,确定所述目标语音数据是否符合预设规定,包括:若所述目标语音数据的关键词含量小于预设关键词含量,确定所述目标语音数据不符合预设规定;若所述目标语音数据的关键词含量大于或等于所述预设关键词含量,确定所述目标语音数据符合预设规定。
9、第二方面,本申请实施例还提供了一种语音质检装置,所述装置包括:
10、获取模块,用于获取目标语音数据;处理模块,用于确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量;检测模块,用于基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定。
11、在一些实施例中,处理模块,具体用于基于以下方式确定目标语音数据的语速和/或目标语音数据包含的关键词含量:基于语音识别技术对目标语音数据进行识别,生成目标文本;基于目标文本确定目标语音数据的语速和/或目标语音数据包含的关键词含量。
12、在一些实施例中,处理模块,具体用于基于以下方式确定目标语音数据的语速和/或目标语音数据包含的关键词含量:若目标语音数据的语速无异常,则基于目标语音数据的关键词含量,检测目标语音数据是否符合预设规定。
13、在一些实施例中,检测模块,具体用于基于以下方式检测目标语音数据是否符合预设规定:若目标语音数据的语速异常,确定目标语音数据不符合预设规定。
14、在一些实施例中,基于以下方式确定目标语音数据的语速是否异常:若目标语音数据的语速小于语速阈值,则确定目标语音数据的语速异常;若目标语音数据的语速大于或等于语速阈值,则确定目标语音数据的语速无异常。
15、在一些实施例中,语速阈值基于正语音样本的语速和负语音样本的语速确定;其中,正语音样本表示合规语音,负语音样本表示不合规语音。
16、在一些实施例中,检测模块,具体用于基于以下方式确定目标语音数据是否符合预设规定,包括:若目标语音数据的关键词含量小于预设关键词含量,确定目标语音数据不符合预设规定;若目标语音数据的关键词含量大于或等于预设关键词含量,确定目标语音数据符合预设规定。
17、第三方面,本申请实施例还提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行上述第一方面的步骤。
18、第四方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储一个或多个程序,一个或多个程序当被包括多个应用程序的电子设备执行时,使得电子设备执行上述第二方面的步骤。
19、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本申请通过检测语音数据的语速,可识别单纯挂通的场景,通过检测语音数据的关键词含量,可以识别播放不相关录音的场景,从而查找出不合规行为。并且本申请的方案无需调用gpu,降低物力消耗和人力消耗。
技术特征:1.一种语音质检方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定,包括:
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定,包括:
5.根据权利要求3或4所述的方法,其特征在于,基于以下方式确定所述目标语音数据的语速是否异常:
6.根据权利要求5所述的方法,其特征在于,所述语速阈值基于正语音样本的语速和负语音样本的语速确定;
7.根据权利要求3所述的方法,其特征在于,所述基于所述目标语音数据的关键词含量,确定所述目标语音数据是否符合预设规定,包括:
8.一种语音质检装置,其特征在于,所述装置包括:
9.一种电子设备,包括:
10.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行如权利要求1-7任一所述的语音质检方法的步骤。
技术总结本申请涉及语音识别技术领域,公开了一种语音质检方法及装置、电子设备、存储介质;其方法包括:获取目标语音数据;确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量;基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定。本申请能够检测出不合规的通话,且无需调用GPU,降低物力消耗和人力消耗。技术研发人员:王月宝,沈鹏,黄明星,周晓波,陈辉亮,段彦夺受保护的技术使用者:北京水滴科技集团有限公司技术研发日:技术公布日:2024/4/17本文地址:https://www.jishuxx.com/zhuanli/20240618/23087.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。