一种数据处理方法、装置、设备以及计算机可读存储介质与流程
- 国知局
- 2024-06-21 11:32:23
本技术涉及互联网,尤其涉及一种数据处理方法、装置、设备以及计算机可读存储介质。
背景技术:
1、音质异常检测在音视频通话、在线会议等业务场景中十分重要。所谓异常音质,并非指环境噪声、声学回声,而是实时通信过程中产生的长时间段静音、失真(例如破音、爆音),采样点不连续(例如卡顿、电流音)等数据异常。
2、在现有技术中,计算机设备获取时序音频数据,并对其进行切分,得到连续的音频帧,对每个音频帧分别进行声压检测或对每个音频帧分别进行相位检测,通过上述的声压检测或相位检测,确定每个音频帧分别对应的异常预测结果,根据一个音频帧对应的异常预测结果,确定该音频帧的帧状态。明显地,现有技术是根据一帧的异常预测结果,确定一帧的帧状态,故在出现单帧误检、漏检时,会错误地确定该单帧的帧状态,此时,降低了音频帧的帧状态的检测准确度。
技术实现思路
1、本技术实施例提供一种数据处理方法、装置、设备以及计算机可读存储介质,可以提高音频帧的帧状态的检测准确度。
2、本技术实施例一方面提供了一种数据处理方法,包括:
3、获取具有第一滤波时间长度的第一帧统计滤波;第一帧统计滤波包括a个音频帧;a为正整数;
4、根据a个音频帧分别对应的异常预测概率,对第一帧统计滤波进行状态检测,得到第一帧统计滤波的激活状态,将携带激活状态的第一帧统计滤波添加至第一滑动窗口;
5、获取第一滑动窗口中的b个帧统计滤波分别对应的激活状态;b为正整数;b个帧统计滤波包括第一帧统计滤波;第一滑动窗口对应的第二滤波时间长度等于b个第一滤波时间长度之和;
6、根据b个激活状态,对第一滑动窗口进行属性检测,得到第一滑动窗口的窗口属性,根据第一滑动窗口的窗口属性,确定b个帧统计滤波的滤波状态。
7、本技术实施例一方面提供了一种数据处理装置,包括:
8、获取模块,用于获取具有第一滤波时间长度的第一帧统计滤波;第一帧统计滤波包括a个音频帧;a为正整数;
9、检测模块,用于根据a个音频帧分别对应的异常预测概率,对第一帧统计滤波进行状态检测,得到第一帧统计滤波的激活状态,将携带激活状态的第一帧统计滤波添加至第一滑动窗口;
10、获取模块,还用于获取第一滑动窗口中的b个帧统计滤波分别对应的激活状态;b为正整数;b个帧统计滤波包括第一帧统计滤波;第一滑动窗口对应的第二滤波时间长度等于b个第一滤波时间长度之和;
11、检测模块,还用于根据b个激活状态,对第一滑动窗口进行属性检测,得到第一滑动窗口的窗口属性,根据第一滑动窗口的窗口属性,确定b个帧统计滤波的滤波状态。
12、在一种可能的实现方式中,检测模块根据a个音频帧分别对应的异常预测概率,对第一帧统计滤波进行状态检测,得到第一帧统计滤波的激活状态,用于执行以下操作:
13、获取a个音频帧分别对应的异常预测概率,将a个异常预测概率与异常概率阈值进行对比;
14、统计a个异常预测概率中,等于或大于异常概率阈值的异常预测概率的第一数量,将第一数量与第一数量阈值进行对比;
15、若第一数量等于或大于第一数量阈值,则将已激活状态确定为第一帧统计滤波的激活状态;
16、若第一数量小于第一数量阈值,则将未激活状态确定为第一帧统计滤波的激活状态。
17、在一种可能的实现方式中,获取模块还用于执行以下操作:
18、统计第一滑动窗口中的帧统计滤波的第二数量,将第二数量与第二数量阈值b进行对比;
19、若第二数量等于b,则执行获取第一滑动窗口中的b个帧统计滤波分别对应的激活状态的步骤;
20、若第二数量小于b,则获取具有第一滤波时间长度的第二帧统计滤波,将确定激活状态的第二帧统计滤波添加至第一滑动窗口中,直至第一滑动窗口包括b个帧统计滤波,执行获取第一滑动窗口中的b个帧统计滤波分别对应的激活状态的步骤;第一帧统计滤波为第二帧统计滤波的上一个帧统计滤波。
21、在一种可能的实现方式中,检测模块根据b个激活状态,对第一滑动窗口进行属性检测,得到第一滑动窗口的窗口属性,用于执行以下操作:
22、统计b个激活状态中的已激活状态的第三数量,将第三数量与第三数量阈值进行对比;
23、若第三数量等于或大于第三数量阈值,则将窗口异常属性确定为第一滑动窗口的窗口属性;
24、若第三数量小于第三数量阈值,则将窗口正常属性确定为第一滑动窗口的窗口属性。
25、在一种可能的实现方式中,第一滑动窗口包括第一时域滑动窗口以及第一频域滑动窗口;第一滑动窗口的窗口属性包括第一时域滑动窗口的窗口属性,以及第一频域滑动窗口的窗口属性;任意一个第一滑动窗口的窗口属性为窗口正常属性或窗口异常属性;
26、检测模块根据第一滑动窗口的窗口属性,确定b个帧统计滤波的滤波状态,用于执行以下操作:
27、若第一时域滑动窗口的窗口属性以及第一频域滑动窗口的窗口属性,均为窗口正常属性,则将滤波正常状态确定为b个帧统计滤波的滤波状态;
28、若第一时域滑动窗口的窗口属性以及第一频域滑动窗口的窗口属性中,存在至少一个窗口属性为窗口异常属性,则对第一时域滑动窗口的窗口属性,以及第一频域滑动窗口的窗口属性进行属性整合处理,得到b个帧统计滤波的滤波状态。
29、在一种可能的实现方式中,若第一时域滑动窗口的窗口属性以及第一频域滑动窗口的窗口属性中,存在至少一个窗口属性为窗口异常属性,则检测模块对第一时域滑动窗口的窗口属性,以及第一频域滑动窗口的窗口属性进行属性整合处理,得到b个帧统计滤波的滤波状态,用于执行以下操作:
30、若第一时域滑动窗口的窗口属性以及第一频域滑动窗口的窗口属性,均为窗口异常属性,则将滤波异常状态确定为b个帧统计滤波的滤波状态;
31、若第一时域滑动窗口的窗口属性为窗口正常属性,且第一频域滑动窗口的窗口属性为窗口异常属性,则获取用于表征窗口正常属性的第一数值,以及用于表征窗口异常属性的第二数值;
32、采用第一时域滑动窗口的窗口权重以及第一频域滑动窗口的窗口权重,对第一数值以及第二数值进行加权求和处理,得到第三数值;
33、将第三数值与异常数值阈值进行对比,若第三数值小于异常数值阈值,则将滤波正常状态确定为b个帧统计滤波的滤波状态;
34、若第三数值等于或大于异常数值阈值,则将滤波异常状态确定为b个帧统计滤波的滤波状态。
35、在一种可能的实现方式中,b个帧统计滤波包括第三帧统计滤波,以及除了第三帧统计滤波之外的b-1个第四帧统计滤波;第三帧统计滤波为b个帧统计滤波中的第一个帧统计滤波;
36、检测模块还用于执行以下操作:
37、若b个帧统计滤波的滤波状态为滤波正常状态,则根据滑动步长,对第一滑动窗口进行滑动处理,得到具有第二滤波时间长度的第二滑动窗口;滑动步长与第一滤波时间长度相同;第二滑动窗口包括b-1个第四帧统计滤波,以及根据滑动处理所得到的第五帧统计滤波;
38、根据b-1个第四帧统计滤波对应的激活状态以及第五帧统计滤波对应的激活状态,对第二滑动窗口进行属性检测,得到第二滑动窗口的窗口属性;
39、根据第二滑动窗口的窗口属性,确定b-1个第四帧统计滤波以及第五帧统计滤波分别对应的滤波状态。
40、在一种可能的实现方式中,检测模块还用于执行以下操作:
41、若b个帧统计滤波的滤波状态为滤波异常状态,则将第一滑动窗口中的b个帧统计滤波进行删除处理;
42、获取具有第一滤波时间长度的第六帧统计滤波,将确定激活状态的第六帧统计滤波添加至第三滑动窗口;第六帧统计滤波为b个帧统计滤波中的最后一个帧统计滤波的下一个帧统计滤波;
43、在第三滑动窗口包括第六帧统计滤波以及b-1个第七帧统计滤波时,根据b-1个第七帧统计滤波对应的激活状态以及第六帧统计滤波对应的激活状态,对第三滑动窗口进行属性检测,得到第三滑动窗口的窗口属性;b-1个第七帧统计滤波对应的获取时间戳晚于为第六帧统计滤波对应的时间戳;
44、根据第三滑动窗口的窗口属性,确定b-1个第七帧统计滤波以及第六帧统计滤波分别对应的滤波状态。
45、在一种可能的实现方式中,a个音频帧包括音频帧cd,d为正整数,且d小于或等于a;
46、获取模块还用于执行以下操作:
47、对音频帧cd进行时域异常检测,得到音频帧cd的时域异常预测概率;
48、对音频帧cd进行频域异常检测,得到音频帧cd的频域异常预测概率;
49、将音频帧cd的时域异常预测概率以及音频帧cd的频域异常预测概率,确定为音频帧cd的异常预测概率。
50、在一种可能的实现方式中,获取模块对音频帧cd进行时域处理,得到音频帧cd的时域异常预测概率,用于执行以下操作:
51、获取音频帧cd所包括的采样点的幅值,对采样点的幅值进行平方处理,得到采样点的幅值平方值;
52、对采样点的幅值平方值进行求和处理,得到采样点的幅值平方总值;
53、对采样点的幅值平方总值进行均值处理,得到采样点的幅值平方均值;
54、对采样点的幅值平方均值进行平方根处理,得到音频帧cd的音频强度值;
55、获取第一强度阈值以及大于第一强度阈值的第二强调阈值,将第一强度阈值以及第二强调阈值均与音频帧cd的音频强度值进行对比;
56、若音频帧cd的音频强度值小于第一强度阈值,或,音频帧cd的音频强度值大于第二强调阈值,则将第四数值确定为音频帧cd的时域异常预测概率;
57、若音频帧cd的音频强度值大于或等于第一强度阈值,且音频帧cd的音频强度值小于或等于第二强调阈值,则将第五数值确定为音频帧cd的时域异常预测概率。
58、在一种可能的实现方式中,获取模块对音频帧cd进行频域处理,得到音频帧cd的频域异常预测概率,用于执行以下操作:
59、对音频帧cd进行时频转换处理,得到音频帧cd的频域信号;
60、获取信号识别模型,将频域信号输入至信号识别模型;
61、通过信号识别模型,对频域信号进行识别处理,得到频域信号的信号异常预测概率;
62、将信号异常预测概率,确定为音频帧cd的频域异常预测概率。
63、在一种可能的实现方式中,获取模块对音频帧cd进行时频转换处理,得到音频帧cd的频域信号,用于执行以下操作:
64、对音频帧cd进行时频转换处理,得到音频帧cd的中间频域信号;
65、若音频帧cd的信号采样率大于信号采样率阈值,则对音频帧cd的中间频域信号进行频带分离处理,在频带分离后的中间频域信号中,获取小于或等于信号采样率阈值的频域信号,将获取到的频域信号确定为音频帧cd的频域信号;
66、若音频帧cd的信号采样率等于或小于信号采样率阈值,则将音频帧cd的中间频域信号,确定为音频帧cd的频域信号。
67、在一种可能的实现方式中,获取模块还用于执行以下操作:
68、若b个帧统计滤波的滤波状态为滤波异常状态,则生成与滤波异常状态相关联的音频异常提示信息;
69、将音频异常提示信息显示于业务客户端,以使业务客户端对应的业务对象基于音频异常提示信息进行设备检查操作;业务客户端是指输出b个帧统计滤波的客户端。
70、本技术一方面提供了一种计算机设备,包括:处理器、存储器、网络接口;
71、上述处理器与上述存储器、上述网络接口相连,其中,上述网络接口用于提供数据通信功能,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以使得计算机设备执行本技术实施例中的方法。
72、本技术实施例一方面提供了一种计算机可读存储介质,上述计算机可读存储介质中存储有计算机程序,上述计算机程序适于由处理器加载并执行本技术实施例中的方法。
73、本技术实施例一方面提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中;计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行本技术实施例中的方法。
74、在本技术实施例中,计算机设备可以获取具有第一滤波时间长度的第一帧统计滤波;第一帧统计滤波包括a个音频帧;a为正整数;根据a个音频帧分别对应的异常预测概率,可以对第一帧统计滤波进行状态检测,得到第一帧统计滤波的激活状态,将携带激活状态的第一帧统计滤波添加至第一滑动窗口;进一步,获取第一滑动窗口中的b个帧统计滤波分别对应的激活状态;b为正整数;b个帧统计滤波包括第一帧统计滤波;第一滑动窗口对应的第二滤波时间长度等于b个第一滤波时间长度之和;根据b个激活状态,可以对第一滑动窗口进行属性检测,得到第一滑动窗口的窗口属性,根据第一滑动窗口的窗口属性,可以确定b个帧统计滤波的滤波状态。上述可知,本技术实施例提出两种类型的滤波,分别为包括音频帧的帧统计滤波以及包括帧统计滤波的滑动窗口,通过a个音频帧分别对应的异常预测概率,确定第一帧统计滤波的激活状态;通过b个激活状态,确定第一滑动窗口的窗口属性;通过第一滑动窗口的窗口属性,确定b个帧统计滤波的滤波状态,即确定b个帧统计滤波所分别包括的音频帧的帧状态;明显地,本技术实施例是通过两种不同类型的滤波,确定音频帧的帧状态,故可以减少单帧误检、漏检所导致的帧特征的检测错误,即可以提高音频帧的帧状态的检测准确度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22096.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表