技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种音频数据处理方法及装置与流程 > 正文

一种音频数据处理方法及装置与流程

国知局
2024-06-21 11:30:03

本申请涉及计算机，尤其涉及一种音频数据处理方法及装置。

背景技术：

1、随着现代化的制造业的发展，工业设备的数量越来越多。通常情况下，设备在正常运行状态下产生的声音与设备在异常运行状态下产生的声音是不相同的。因此，技术人员可以根据设备产生的声音判断该设备的运行状态是否正常。为了降低技术人员的工作量，如何自动根据机器运行时产生的声音判断设备的运行状态是否异常，成为现代化制造领域发展的关键点。异常声音检测(anomalous sound detection,asd)技术可以根据设备运行时产生的声音判断该设备的运行状态是否异常，从而可以实现设备的故障检测及预测性维护。

2、目前现有技术中的asd技术方案包括无监督asd技术方案。无监督asd技术方案是指通过比较标准音频数据的似然分布与待检测音频数据的似然分布，判断待检测音频数据是否为异常数据。然而，无监督asd技术方案对正常声音的音频文件进行特征学习的能力较低，从而无法准确判断待检测的音频数据是否异常。

技术实现思路

1、本发明通过了一种音频数据处理方法及装置，用以提高判断待检测的音频数据是否异常的准确性。

2、第一方面，本申请实施例提供了一种音频数据处理方法，包括：获取待检测的音频数据。采用第一数据模型对该待检测的音频数据进行处理，获得处理后的音频数据，该第一数据模型是对多个正常音频数据的子特征进行训练获得的，正常音频数据的子特征是从时间维度将正常音频数据的特征进行分段处理获得的。对比该待检测的音频数据和该处理后的音频数据，判断该待检测的音频数据是否为异常数据。

3、采用该方法，由于第一数据模型是对多个正常音频数据的子特征进行训练获得的，正常音频数据的子特征是从时间维度将正常音频数据的特征进行分段处理获得的，则第一设备可以通过第一数据模型获得的处理后的音频数据，并根据处理后的音频数据和待处理的音频数据确定待处理的音频数据是否为异常数据，从而可以提高判断待检测的音频数据是否异常的准确性。

4、在一种可能的设计中，第一数据模型的训练过程包括根据前向扩散方法对多个正常音频数据的子特征进行加噪处理，获得多个正常音频数据的加噪子特征。

5、基于该设计，通过前向扩散的方法对正常音频数据进行加噪处理的方式训练第一数据模型，可以提高第一数据模型的性能。

6、在一种可能的设计中，第一数据模型的训练过程还包括根据反向去噪方法对多个正常音频数据的加噪子特征进行去噪处理，获得多个正常音频数据的还原子特征。

7、基于该设计，通过反向去噪的方法对正常音频数据的加噪子特征进行去噪处理的方式训练第一数据模型，可以提高第一数据模型的性能。

8、在一种可能的设计中，根据异常检测函数对该待检测的音频数据与该处理后的音频数据进行处理，获得异常分数。根据该异常分数判断该待检测的音频数据是否为异常数据。

9、基于该设计，采用异常检测函数对处理前后特征图进行处理获得相应的异常分数，并根据异常分数判断待检测的数据是否为异常数据，可以提高检测音频数据是否异常的准确性和检测效率。

10、在一种可能的设计中，该异常分数满足：

11、

12、其中，sanomaly表示该异常分数，f，t为设定参数，xij表示该待检测的音频数据的特征图上坐标为(i，j)的像素点的亮度，表示该处理后的音频数据的特征图上坐标为(i，j)的像素点的亮度，∑为累加符号。

13、基于该设计，根据特征图上的每个像素点的亮度确定异常分数，可以保证异常分数的合理性，从而提高检测音频数据是否异常的准确性。

14、第二方面，本申请实施例还提供了一种音频数据处理装置，包括通信模块和处理模块。其中：

15、通信模块，用于获取待检测的音频数据。处理模块，用于采用第一数据模型对该待检测的音频数据进行处理，获得处理后的音频数据，该第一数据模型是对多个正常音频数据的子特征进行训练获得的，正常音频数据的子特征是从时间维度将正常音频数据的特征进行分段处理获得的。该处理模块，还用于根据该待检测的音频数据和该处理后的音频数据，判断该待检测的音频数据是否为异常数据。

16、在一种可能的设计中，第一数据模型的训练过程包括根据前向扩散方法对多个正常音频数据的子特征进行加噪处理，获得多个正常音频数据的加噪子特征。

17、在一种可能的设计中，第一数据模型的训练过程还包括根据反向去噪方法对多个正常音频数据的加噪子特征进行去噪处理，获得多个正常音频数据的还原子特征。

18、在一种可能的设计中，该处理模块具体用于：

19、根据异常检测函数对该待检测的音频数据与该处理后的音频数据进行处理，获得异常分数。

20、根据该异常分数判断该待检测的音频数据是否为异常数据。

21、在一种可能的设计中，该异常分数满足：

22、

23、其中，sanomaly表示该异常分数，f，t为设定参数，xij表示该待检测的音频数据的特征图上坐标为(i，j)的像素点的亮度，表示该处理后的音频数据的特征图上坐标为(i，j)的像素点的亮度，∑为累加符号。

24、第三方面，本申请实施例还提供了一种电子设备，所述电子设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现第一方面及其任意一种设计的方法。

25、第四方面，本申请实施例还提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现第一方面及其任意一种设计的方法。

26、第二方面至第四方面及其任意一种设计所带来的技术效果可参见第一方面中对应的设计所带来的技术效果，此处不再赘述。

技术特征：

1.一种音频数据处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述第一数据模型的训练过程包括根据前向扩散方法对所述多个正常音频数据的子特征进行加噪处理，获得多个正常音频数据的加噪子特征。

3.如权利要求2所述的方法，其特征在于，所述第一数据模型的训练过程还包括根据反向去噪方法对所述多个正常音频数据的加噪子特征进行去噪处理，获得多个正常音频数据的还原子特征。

4.如权利要求1所述的方法，其特征在于，所述对比所述待检测的音频数据的特征图与所述处理后的音频数据的特征图，判断所述待检测的音频数据是否为异常数据，包括：

5.如权利要求4所述的方法，其特征在于，所述异常分数满足：

6.一种音频数据处理装置，其特征在于，所述装置包括：

7.如权利要求6所述的装置，其特征在于，所述第一数据模型的训练过程包括根据前向扩散方法对所述多个正常音频数据的子特征进行加噪处理，获得多个正常音频数据的加噪子特征。

8.如权利要求7所述的装置，其特征在于，所述第一数据模型的训练过程还包括根据反向去噪方法对所述多个正常音频数据的加噪子特征进行去噪处理，获得多个正常音频数据的还原子特征。

9.如权利要求6所述的装置，其特征在于，所述处理模块具体用于：

10.如权利要求9所述的装置，其特征在于，所述异常分数满足：

11.一种电子设备，其特征在于，所述电子设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一所述方法的步骤。

12.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-5中任一所述方法的步骤。

技术总结本申请公开了一种音频数据处理方法及装置，计算机技术领域，用以提高判断待检测的音频数据是否异常的准确性。该方法包括：第一设备可以采用第一数据模型对获取的待检测的音频数据进行处理，获得处理后的音频数据。其中，第一数据模型是对多个正常音频数据的子特征进行训练获得的。正常音频数据的子特征是从时间维度将正常音频数据的特征进行分段处理获得的。第一设备可以根据处理后的音频数据和待检测的音频数据，判断待检测的音频数据是否为异常数据。技术研发人员：谢湘,张奉润受保护的技术使用者：中嘉云商（北京）科技有限公司技术研发日：技术公布日：2024/2/25