数据处理方法、装置、电子设备和计算机可读存储介质与流程
- 国知局
- 2024-06-21 11:49:12
本申请涉及音频处理,特别涉及一种数据处理方法、装置、电子设备和计算机可读存储介质。
背景技术:
1、随着人工智能技术和音频处理技术的发展,音频处理技术在智能语音识别业务中得到越来越广泛的应用。例如,基于智能语音识别技术的语音交互系统,可以替代运营商客服与客户进行多轮对话。
2、在实际应用场景中,相较于传统机器人仅限于电话呼出和语音播放,基于智能语音识别技术的语音交互系统,在与客户进行多轮对话的过程中,可以为客户提供语音打断功能。语音打断指在语音交互系统输出音频数据时,该音频数据的播放可以直接通过语音进行打断,从而实现智能语音交互。因此,在为客户提供语音打断功能时,需要提高对音频数据进行处理的准确性。
技术实现思路
1、本申请提供一种数据处理方法、装置、电子设备和计算机可读存储介质,可以提高提高对音频数据进行处理的准确性。
2、第一方面,本申请提供了一种数据处理方法,该数据处理方法包括:响应于资源控制终端的数据处理请求,将获取的播放状态的音频数据发送至第一音频处理设备;接收所述第一音频处理设备反馈的所述音频数据的声纹识别结果和所述音频数据的语音识别结果;将所述声纹识别结果和所述语音识别结果与至少一个判定规则进行匹配,得到所述音频数据的规则匹配结果;根据所述音频数据的规则匹配结果确定是否需要打断所述音频数据的播放,生成并发送对应的通知消息至所述资源控制终端。
3、第二方面,本申请提供了一种数据处理装置,该数据处理装置包括:发送模块,用于响应于资源控制终端的数据处理请求,将获取的播放状态的音频数据发送至第一音频处理设备;接收模块,用于接收所述第一音频处理设备反馈的所述音频数据的声纹识别结果和所述音频数据的语音识别结果;匹配模块,用于将所述声纹识别结果和所述语音识别结果与至少一个判定规则进行匹配,得到所述音频数据的规则匹配结果;所述发送模块,还用于根据所述音频数据的规则匹配结果确定是否需要打断所述音频数据的播放,生成并发送对应的通知消息至所述资源控制终端。
4、第三方面,本申请提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的数据处理方法。
5、第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器/处理核执行时实现上述的数据处理方法。
6、本申请所提供的实施例,可以在接收到资源控制终端的数据处理请求的情况下,将资源控制终端请求处理的音频数据发送至第一音频处理设备进行处理,并在接收到第一音频处理设备反馈的声纹识别结果和语音识别结果之后,将声纹识别结果和语音识别结果与至少一个判定规则进行匹配,得到音频数据的规则匹配结果,并根据该规则匹配结果确定是否需要打断音频数据的播放,生成并发送对应的通知消息至资源控制终端。
7、在本申请的方案中,可以结合音频数据的声纹识别结果和语音识别结果,对是否需要打断音频数据的播放进行判定,声纹识别也称说话人识别,将声纹识别引入对音频数据的打断判定中,有利于在嘈杂背景下可能存在多人说话的场景中提高判定结果的准确性;并且,相关技术中,只有在需要打断音频数据的播放时,才发送打断通知消息,在本申请的方案中,无论是需要打断音频数据的播放,还是无需打断音频数据的播放,均可以生成并发送对应的通知消息至资源控制终端,与相关技术相比,本申请的方案对于无需打断音频数据的播放也会有明确的通知,从而使资源控制终端对于每条音频数据都可以及时获知对其进行打断或不打断的处理结果,有利于增强数据处理过程中判定结果的确定性。
8、应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
技术特征:1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将获取的播放状态的音频数据发送至第一音频处理设备,包括:
3.根据权利要求1所述的方法,其特征在于,所述判定规则包括打断规则和打断忽略规则;所述根据所述音频数据的规则匹配结果确定是否需要打断所述音频数据的播放,生成并发送对应的通知消息至所述资源控制终端,包括:
4.根据权利要求3所述的方法,其特征在于,
5.根据权利要求3所述的方法,其特征在于,所述打断规则包括如下规则中的至少一项:
6.根据权利要求3所述的方法,其特征在于,所述生成第一通知消息,包括:
7.根据权利要求1所述的方法,其特征在于,所述音频数据为音频测试数据;所述规则匹配结果包括所述音频测试数据的匹配到的判定规则;在生成并发送对应的通知消息至所述资源控制终端之后,所述方法还包括:
8.一种数据处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-7中任一项所述的数据处理方法。
技术总结本申请提供了一种数据处理方法、装置、电子设备和计算机可读存储介质,该方法包括:响应于资源控制终端的数据处理请求,将获取的播放状态的音频数据发送至第一音频处理设备;接收第一音频处理设备反馈的音频数据的声纹识别结果和音频数据的语音识别结果;将声纹识别结果和语音识别结果与至少一个判定规则进行匹配,得到音频数据的规则匹配结果;根据音频数据的规则匹配结果确定是否需要打断音频数据的播放,生成并发送对应的通知消息至资源控制终端。根据本申请的实施例,可以提高对音频数据进行处理的准确性。技术研发人员:周丽君受保护的技术使用者:马上消费金融股份有限公司技术研发日:技术公布日:2024/5/6本文地址:https://www.jishuxx.com/zhuanli/20240618/23751.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表