技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于数据分析的远程音频信息处理方法及系统与流程 > 正文

一种基于数据分析的远程音频信息处理方法及系统与流程

国知局
2024-06-21 10:39:00

本发明涉及音频信息处理，特别是一种基于数据分析的远程音频信息处理方法及系统。

背景技术：

1、近年来，基于数据分析的技术逐渐应用于音频领域，为远程音频信息处理提供了新的解决方案。在传统的音频处理方法中，通常采用人工进行数据分析和处理，容易受到主观因素的影响。而利用数据分析技术，可以从大量音频数据中提取特征，进行自动化处理和分析，提高了音频处理的效率和准确性。然而，基于数据分析的远程音频信息处理方法在当前技术水平下仍存在一些潜在的技术缺陷，如在复杂环境下，如多人通话、背景噪声干扰等情况下，对音频信号的准确处理和分析面临挑战，需要复杂的信号处理算法和技术支持，难以精准的分析出存在噪声干扰的音频时段加以处理，导致音频质量低下。

技术实现思路

1、本发明克服了现有技术的不足，提供了一种基于数据分析的远程音频信息处理方法及系统。

2、为达到上述目的本发明采用的技术方案为：

3、本发明第一方面公开了一种基于数据分析的远程音频信息处理方法，包括以下步骤：

4、获取预设时间段内待分析的音频信号，将音频信号分成不重叠的短时帧信号，并将所述短时帧信号进行降维处理，得到由音频特征数据组成的特征矩阵；

5、引入奇异值分解算法，并基于奇异值分解算法剔除所述特征矩阵的冗余点，得到降冗后的特征矩阵；

6、对所述降冗后的特征矩阵进行逆变换与反标准化处理，得到逆变换和反标准化后的数据矩阵，根据逆变换和反标准化后的数据矩阵生成预设时间段内待分析音频信号的实际波形图；

7、将所述待分析音频信号的实际波形图与相应的标准波形图进行比较分析，得到分析结果；基于所述分析结果，对相应时段的音频信号进行处理。

8、进一步地，本发明的一个较佳实施例中，获取预设时间段内待分析的音频信号，将音频信号分成不重叠的短时帧信号，并将所述短时帧信号进行降维处理，得到由音频特征数据组成的特征矩阵，具体为：

9、获取预设时间段内的音频信号，并将音频信号分成不重叠的短时帧信号，基于特征提取算法提取每帧短时帧信号的特征向量；

10、将每帧短时帧信号的特征向量拼接成一个具有多行的矩阵，其中每一行是一个特征向量，将矩阵中每个特征进行标准化处理，以确保每个特征具有相同的权重，得到标准化后的矩阵；

11、根据所述标准化后的矩阵计算协方差矩阵，协方差矩阵描述了不同特征之间的相关性和方差；

12、对协方差矩阵进行特征值分解，以获得特征值和新的特征向量，特征值表示信号数据在新的特征向量方向上的方差大小，新的特征向量表示信号数据在新的主成分空间中的方向；

13、根据特征值的大小，选择前 k 个特征值对应的新的特征向量作为主成分；其中，选择的主成分数根据特征值之和的百分比来确定；

14、将标准化后的矩阵与选定的主成分构成的矩阵相乘，得到由音频特征数据组成的特征矩阵。

15、进一步地，本发明的一个较佳实施例中，引入奇异值分解算法，并基于奇异值分解算法剔除所述特征矩阵的冗余点，得到降冗后的特征矩阵，具体为：

16、引入奇异值分解算法，并基于奇异值分解算法对所述特征矩阵进行奇异分解处理，得到左奇异矩阵、奇异值矩阵以及右奇异矩阵；

17、根据奇异值矩阵中的奇异值来确定出每个特征点的独立程度；其中，奇异值的大小表示相应特征点在特征矩阵中的独立性，奇异值越大特征点的独立性越大；

18、将每个特征点的独立程度与预设阈值进行比较；将独立程度小于预设阈值的特征点视为冗余点；并去除左奇异矩阵、奇异值矩阵以及右奇异矩阵中与各冗余点相应的列，以剔除冗余的特征点；

19、更新左奇异矩阵、奇异值矩阵以及右奇异矩阵，并将更新后的左奇异矩阵、奇异值矩阵以及右奇异矩阵相乘，得到降冗后的特征矩阵。

20、进一步地，本发明的一个较佳实施例中，对所述降冗后的特征矩阵进行逆变换与反标准化处理，得到逆变换和反标准化后的数据矩阵，根据逆变换和反标准化后的数据矩阵生成预设时间段内待分析音频信号的实际波形图，具体为：

21、基于逆变换的方式，将降冗后的特征矩阵进行逆变换处理，获得逆变换后的数据矩阵，逆变换后的数据矩阵与原短时帧信号的格式和维度相匹配；

22、基于反标准化的方式，将降冗后的特征矩阵进行反标准化处理，获得反标准化后的数据矩阵，反标准化后的数据矩阵与原短时帧信号的尺度和范围相匹配；

23、获取音频的声道数和采样率，根据音频的声道数和采样率，将逆变换和反标准化后的数据矩阵进行重新组合与特征转换，得到音频波形数据；

24、其中，若音频是双声道，则将重新组合数据矩阵的列分为两部分，分别表示左声道和右声道的音频波形数据；若音频是单声道，则将重新组合数据矩阵的所有列作为音频波形数据；

25、创建一个绘图区域，并设置好坐标轴的范围和标签，根据所述音频波形数据绘制得到待分析音频信号的实际波形图；其中，坐标横轴表示时间，坐标纵轴表示音频振幅。

26、进一步地，本发明的一个较佳实施例中，将所述待分析音频信号的实际波形图与相应的标准波形图进行比较分析，得到分析结果，具体为：

27、通过大数据网络获取各种预设类型音频信号对应的标准波形图，构建数据库，并将各种预设类型音频信号对应的标准波形图导入所述数据库中，得到特性数据库；

28、获取待分析音频信号的类型信息，根据所述待分析音频信号的类型信息构建检索标签，基于所述检索标签在所述特性数据库中检索得到与待分析音频信号的标准波形图；

29、通过欧几里得距离算法计算待分析音频信号的实际波形图与标准波形图之间的欧几里得距离值，根据所述欧几里得距离值确定出实际波形图与标准波形图之间的重合度；

30、若所述重合度不大于预设重合度，则生成第一分析结果；若所述重合度大于预设重合度，则生成第二分析结果。

31、进一步地，本发明的一个较佳实施例中，基于所述分析结果，对相应时段的音频信号进行处理，具体为：

32、若分析结果为第一分析结果，则构建配对空间，将所述实际波形图与标准波形图导入所述配对空间中；

33、在所述配对空间检索出实际波形图与标准波形图的坐标轴位置，并将两者的坐标轴进行整合，以将实际波形图与标准波形图进行配对处理；

34、配对完成后，将实际波形图与标准波形图互相重合的图形区域筛除，并保留不相重合的图形区域，得到波形偏差图；

35、在所述波形偏差图中识别出剩余图形区域所对应的时间段，并将剩余图形区域所对应的时间段标记为异常信号时段；

36、将异常信号时段所对应的音频信号进行降噪、音频增强以及音频修复处理。

37、本发明第二方面公开了一种基于数据分析的远程音频信息处理系统，所述远程音频信息处理系统包括存储器与处理器，所述存储器中存储有远程音频信息处理方法程序，当所述远程音频信息处理方法程序被所述处理器执行时，实现如下步骤：

38、获取预设时间段内待分析的音频信号，将音频信号分成不重叠的短时帧信号，并将所述短时帧信号进行降维处理，得到由音频特征数据组成的特征矩阵；

39、引入奇异值分解算法，并基于奇异值分解算法剔除所述特征矩阵的冗余点，得到降冗后的特征矩阵；

40、对所述降冗后的特征矩阵进行逆变换与反标准化处理，得到逆变换和反标准化后的数据矩阵，根据逆变换和反标准化后的数据矩阵生成预设时间段内待分析音频信号的实际波形图；

41、将所述待分析音频信号的实际波形图与相应的标准波形图进行比较分析，得到结果；基于所述分析结果，对相应时段的音频信号进行处理。

42、进一步地，本发明的一个较佳实施例中，获取预设时间段内待分析的音频信号，将音频信号分成不重叠的短时帧信号，并将所述短时帧信号进行降维处理，得到由音频特征数据组成的特征矩阵，具体为：

43、获取预设时间段内的音频信号，并将音频信号分成不重叠的短时帧信号，基于特征提取算法提取每帧短时帧信号的特征向量；

44、将每帧短时帧信号的特征向量拼接成一个具有多行的矩阵，其中每一行是一个特征向量，将矩阵中每个特征进行标准化处理，以确保每个特征具有相同的权重，得到标准化后的矩阵；

45、根据所述标准化后的矩阵计算协方差矩阵，协方差矩阵描述了不同特征之间的相关性和方差；

46、对协方差矩阵进行特征值分解，以获得特征值和新的特征向量，特征值表示信号数据在新的特征向量方向上的方差大小，新的特征向量表示信号数据在新的主成分空间中的方向；

47、根据特征值的大小，选择前 k 个特征值对应的新的特征向量作为主成分；其中，选择的主成分数根据特征值之和的百分比来确定；

48、将标准化后的矩阵与选定的主成分构成的矩阵相乘，得到由音频特征数据组成的特征矩阵。

49、进一步地，本发明的一个较佳实施例中，引入奇异值分解算法，并基于奇异值分解算法剔除所述特征矩阵的冗余点，得到降冗后的特征矩阵，具体为：

50、引入奇异值分解算法，并基于奇异值分解算法对所述特征矩阵进行奇异分解处理，得到左奇异矩阵、奇异值矩阵以及右奇异矩阵；

51、根据奇异值矩阵中的奇异值来确定出每个特征点的独立程度；其中，奇异值的大小表示相应特征点在特征矩阵中的独立性，奇异值越大特征点的独立性越大；

52、将每个特征点的独立程度与预设阈值进行比较；将独立程度小于预设阈值的特征点视为冗余点；并去除左奇异矩阵、奇异值矩阵以及右奇异矩阵中与各冗余点相应的列，以剔除冗余的特征点；

53、更新左奇异矩阵、奇异值矩阵以及右奇异矩阵，并将更新后的左奇异矩阵、奇异值矩阵以及右奇异矩阵相乘，得到降冗后的特征矩阵。

54、进一步地，本发明的一个较佳实施例中，对所述降冗后的特征矩阵进行逆变换与反标准化处理，得到逆变换和反标准化后的数据矩阵，根据逆变换和反标准化后的数据矩阵生成预设时间段内待分析音频信号的实际波形图，具体为：

55、基于逆变换的方式，将降冗后的特征矩阵进行逆变换处理，获得逆变换后的数据矩阵，逆变换后的数据矩阵与原短时帧信号的格式和维度相匹配；

56、基于反标准化的方式，将降冗后的特征矩阵进行反标准化处理，获得反标准化后的数据矩阵，反标准化后的数据矩阵与原短时帧信号的尺度和范围相匹配；

57、获取音频的声道数和采样率，根据音频的声道数和采样率，将逆变换和反标准化后的数据矩阵进行重新组合与特征转换，得到音频波形数据；

58、其中，若音频是双声道，则将重新组合数据矩阵的列分为两部分，分别表示左声道和右声道的音频波形数据；若音频是单声道，则将重新组合数据矩阵的所有列作为音频波形数据；

59、创建一个绘图区域，并设置好坐标轴的范围和标签，根据所述音频波形数据绘制得到待分析音频信号的实际波形图；其中，坐标横轴表示时间，坐标纵轴表示音频振幅。

60、本发明解决了背景技术中存在的技术缺陷，本发明具备以下有益效果：获取预设时间段内待分析的音频信号，将音频信号分成不重叠的短时帧信号，并将所述短时帧信号进行降维处理，得到由音频特征数据组成的特征矩阵；引入奇异值分解算法，并基于奇异值分解算法剔除所述特征矩阵的冗余点，得到降冗后的特征矩阵；对所述降冗后的特征矩阵进行逆变换与反标准化处理，得到逆变换和反标准化后的数据矩阵，根据逆变换和反标准化后的数据矩阵生成预设时间段内待分析音频信号的实际波形图；将所述待分析音频信号的实际波形图与相应的标准波形图进行比较分析，得到结果；基于所述分析结果，对相应时段的音频信号进行处理。本发明能够快速精准筛选出异常音频部分并有针对性地加以处理，能够有效提高音频处理效率与音频整体质量。