一种多音频数据智能处理方法与流程
- 国知局
- 2024-06-21 11:54:14
本发明涉及音频数据处理,具体涉及一种多音频数据智能处理方法。
背景技术:
1、音频数据作为智能设备的人机交互的重要方式,通过麦克风设备获取的音频数据,再对获取的音频数据进行分析可以实现人机交互。在通过麦克风获取音频数据时,获取的音频数据的质量对后续的语音交互的准确性存在较大的影响。在进行语音交互时需要对获取的声音数据进行预处理,避免获取的声音中的噪声的干扰影响后续的处理。
2、因此可以通过emd分解算法对音频数据进行处理,但是在通过emd算法对多音频数据分解成imf分量时,由于获取的数据本身的频率波动较为复杂,同时其呈现的叠加情况呈现非线性,因此会导致获取的imf分量中相似时间尺度的信号会存在于不同的imf中,与不同频率的imf分量相互叠加的现象;对叠加的imf分量进行去噪时,其去噪的效果不理想,影响后续的语音交互的流畅性。
技术实现思路
1、为了解决现有技术对音频数据emd分解得到的imf分量进行去噪时,存在去噪的效果不理想技术问题,本发明的目的在于提供一种多音频数据智能处理方法,所采用的技术方案具体如下:
2、一种多音频数据智能处理方法,所述方法包括:
3、通过多个不同位置的音频采集设备采集得到多组原始音频数据;
4、将每组原始音频数据分解为第一imf分量数据;
5、对每组原始音频数据加入不同程度的白噪声,并将加入白噪声后的每组原始音频数据分解为第二imf分量数据;
6、根据分析imf分量数据的波动变化一致性,获取imf分量数据对应的有效稳定值;其中所述imf分量包括第一imf分量数据、第二imf分量数据;所述有效稳定值包括对第一imf分量数据、第二imf分量数据分别对应的第一有效稳定值、第二有效稳定值;
7、根据第一有效稳定值与第二有效稳定值的变化情况,计算第一imf分量数据的重构权重;
8、根据获取得重构权重对第一imf分量数据进行加权重构,得到重构后的音频数据。
9、优选地,根据分析imf分量数据的波动变化一致性,获取imf分量数据对应的有效稳定值,包括:
10、根据得到的imf分量数据获取每时刻对应的语谱图数据,根据语谱图数据分析每个音频采集设备不同时刻采集的音频数据之间的变化相似度;
11、根据获取每个音频采集设备不同时刻采集的音频数据的相似分布情况,计算该时刻采集的音频数据的有效性;
12、根据每个音频采集设备采集的音频数据之间的变化相似度与有效性,对不同位置的音频采集设备之间采集的音频数据进行匹配,得到匹配结果;
13、根据匹配结果计算某一位置的音频采集设备某一时刻采集的音频数据的有效稳定性。
14、进一步地,根据得到的imf分量数据获取每时刻对应的语谱图数据,根据语谱图数据分析每个音频采集设备不同时刻采集的音频数据之间的变化相似度,包括如下:
15、根据得到的imf分量数据获取每时刻对应的语谱图数据;
16、根据语谱图数据中两个对应的像素点的梯度方向的三角函数,分析两个对应的像素点在语谱图数据中的结构变化一致情况;
17、计算语谱图数据中的两个对应的像素点的灰度差值的绝对值,与语谱图数据中的所有像素点的灰度差值的均值;
18、计算灰度差值的绝对值与灰度差值的均值之间的稳定情况;
19、根据结构变化一致情况与稳定情况,计算得到每个音频采集设备不同时刻采集的音频数据之间的变化相似度。
20、进一步地,根据获取每个音频采集设备不同时刻采集的音频数据的相似分布情况,计算该时刻采集的音频数据的有效性,包括:
21、根据预设波动相似阈值,确定与每个音频采集设备不同时刻采集的音频数据波动相似的相似数据点;
22、根据相似数据点与对应时刻之间的时间差,计算该时刻采集的音频数据的有效性。
23、进一步地,根据每个音频采集设备采集的音频数据之间的变化相似度与有效性,对不同位置的音频采集设备之间采集的音频数据进行匹配,得到匹配结果,包括:
24、获取某一个位置的某一时刻采集的音频数据的第一有效性;
25、获取另一个位置的另一时刻采集的音频数据的第二有效性;
26、计算第一有效性与第二有效性之间的第一差值;
27、根据第一差值与每个音频采集设备不同时刻采集的音频数据之间的变化相似度,计算任意两个位置之间的匹配结果,得到多个匹配结果;
28、选取匹配结果最大的作为最终的匹配结果。
29、再进一步地,根据匹配结果计算某一位置的音频采集设备某一时刻采集的音频数据的有效稳定性,包括:
30、获取某一个位置的某一时刻采集的音频数据的第一震动幅值;
31、获取另一个位置的另一时刻采集的音频数据的第二震动幅值;
32、计算第一震动幅值与第二震动幅值之间的第二差值;
33、根据第二差值、最终的匹配结果计算某一位置的音频采集设备某一时刻采集的音频数据的有效稳定性。
34、优选地,根据第一有效稳定值与第二有效稳定值的变化情况,计算第一imf分量数据的重构权重,包括:
35、分别获取第一有效稳定值、第二有效稳定值、及与第一有效稳定值、第二有效稳定值对应时刻的音频数据的第一幅值、第二幅值;
36、根据每次加入白噪声的程度,结合第一有效稳定值、第二有效稳定值、第一幅值、第二幅值,计算第一imf分量数据与第二imf分量数据之间的第三差值;
37、根据多次加入不同程度的白噪声,累计计算第三差值之和;
38、根据得到的第三差值之和计算得到第一imf分量数据的重构权重。
39、优选地,采用emd算法分别将每组原始音频数据分解为第一imf分量数据,将加入白噪声后的每组原始音频数据分解为第二imf分量数据。
40、一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述的多音频数据智能处理方法。
41、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如所述的多音频数据智能处理方法。
42、本发明具有如下有益效果:
43、本发明通过将每组原始音频数据分解为第一imf分量数据,分析获取的第一imf分量数据的波动变化一致性,获取第一imf分量数据;同时对每组原始音频数据加入不同程度的白噪声,分析获取的第二imf分量数据的波动变化一致性,获取第二imf分量数据对应的有效稳定值;利用得到的第一有效稳定值与第二有效稳定值,计算第一有效稳定值与第二有效稳定值的变化情况,从而计算第一imf分量数据的重构权重,实现对后续imf分量的变化情况进行加权;避免了在进行emd分解时,获取的imf分量中相似时间尺度的信号存在于不同的imf分量中,与不同频率的分解imf分量相互叠加的现象。本发明通过获取第一有效稳定值与第二有效稳定值进行重构时,对第一imf分量数据进行加权,有效的避免了在对叠加的imf分量进行去噪时去噪的效果不理想的问题,从而避免影响后续的音频数据质量,保障后续的语音交互的流畅性。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24378.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。