技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频处理方法、音频处理装置、电子设备和存储介质与流程  >  正文

音频处理方法、音频处理装置、电子设备和存储介质与流程

  • 国知局
  • 2024-06-21 11:50:08

本技术涉及语音信号处理领域,并且更具体地,涉及语音信号处理领域中一种音频处理方法、音频处理装置、电子设备和存储介质。

背景技术:

1、随着生活水平的提升,越来越多的家庭开始为孩子创造学习乐器的机会,很多孩子甚至还有第二乐器。但是学习乐器的过程中,需要在平时进行大量练习,而由于多数家长没有相关的乐器知识,无法对乐器的演奏效果进行评估和指导,需要寻求专业人士的帮助对乐器的演奏效果进行评估和指导,但是这种方式需要消耗大量人力和时间,导致很多孩子学习进度较慢。

2、相关技术中,通过谱熵梅尔积对乐器的演奏音频数据进行处理,并使用处理后的音频数据对乐器的演奏效果进行评估与指导。但是,由于周围环境存在噪音干扰且谱熵梅尔积处理的降噪声能力较差,从而导致演奏音频数据的评估结果的准确性较低,进而使得基于评估结果得到的指导出现偏差。

3、因此,如何提高演奏音频数据评估结果的准确性是当前亟需解决的问题。

技术实现思路

1、本技术提供了一种音频处理方法、音频处理装置、电子设备和存储介质,该方法能够提高演奏音频数据评估结果的准确性。

2、第一方面,提供了一种音频处理方法,该方法包括:

3、获取目标音频数据,目标音频数据包括演奏音频数据与背景音频数据;通过第一滤波器对目标音频数据进行处理,得到第一音频特征;通过第二滤波器对目标音频数据进行处理,得到第二音频特征;其中,第一滤波器的降噪性能优于第二滤波器的降噪性能;基于第二音频特征对第一音频特征进行调整,得到目标音频特征;基于目标音频特征,得到演奏音频数据的评估结果。

4、在本技术实施例中,由于对演奏音频数据的评估可能会受到背景音频数据的干扰,因此使用降噪性能较好的第一滤波器得到对应的第一音频特征,降低背景音频数据对演奏音频数据评估结果的影响。此外,引入了第二滤波器,并使用第二滤波器得到第二音频特征对第一音频特征进行调整,相较于单一音频特征,通过音频特征之间的相互调整可以提高目标音频特征的准确性,从而得到降噪性能优异且精准度较好的目标音频特征,并在此基础上,使用目标音频特征对演奏音频数据进行评估,提高了评估结果的准确性。

5、结合第一方面,在第一方面的某些实现方式中,上述基于第二音频特征对第一音频特征进行调整,得到目标音频特征,包括:

6、判断第一音频特征的特征值与第二音频特征的特征值的大小;若第一音频特征的特征值大于第二音频特征的特征值,确定目标调整量为第三音频特征;其中,第三音频特征是对第二音频特征进行归零处理得到的;若第一音频特征的特征值小于第三音频特征的特征值,确定目标调整量为第二音频特征;将目标调整量与第一音频特征相加,得到目标音频特征。

7、结合第一方面和上述实现方式,在第一方面的某些实现方式中,若上述第二音频特征为多个第二音频特征;上述基于第二音频特征对第一音频特征进行调整,得到目标音频特征,包括:

8、确定多个第二音频特征对应的目标第二音频特征;其中,目标第二音频特征为多个第二音频特征的均值特征或者多个第二音频特征中的极值特征;判断第一音频特征的特征值与目标第二音频特征的特征值的大小;若第一音频特征的特征值大于目标第二音频特征的特征值,确定目标调整量为第四音频特征;其中,第四音频特征是对目标第二音频特征进行归零处理得到的;若第一音频特征的特征值小于第四音频特征的特征值,确定目标调整量为目标第二音频特征;将目标调整量与第一音频特征相加,得到目标音频特征。

9、在本技术实施例中,在第二音频特征的数量为多个时,可以计算多个第二音频特征的均值特征或者多个第二音频特征中的极值特征,将均值特征或者极值特征作为目标第二音频特征。由于目标第二音频特征是多个第二音频特征的均值特征或者极值特征,是经过均值处理或者排序筛选得到的,从而提高了目标第二音频特征的准确性,进而基于均值特征,或者极值特征得到的目标调整量更加准确;从而提高获取到的目标音频特征的准确性,进而提高了评估结果的准确性。

10、结合第一方面和上述实现方式,在第一方面的某些实现方式中,上述通过第一滤波器与第二滤波器对目标音频数据进行滤波处理,生成第一音频特征与第二音频特征,包括:

11、将目标音频数据输入第一滤波器,得到第一声学特征;通过对第一声学特征进行卷积处理,得到第一音频特征;将目标音频数据输入第二滤波器,得到第二声学特征;通过对第二声学特征进行卷积处理与降维处理,得到第二音频特征。

12、在本技术实施例中,由于经过卷积处理后的第一音频特征和第二音频特征可能均为高维特征,而高维特征之间的比较以及计算比较复杂,且不容易调控。因此,通过对第二声学特征进行降维处理,可以降低特征之间比较的难度和数据处理的难度。

13、结合第一方面和上述实现方式,在第一方面的某些实现方式中,上述通过第一滤波器与第二滤波器对目标音频数据进行滤波处理,得到第一音频特征与第二音频特征,包括:

14、将目标音频数据分别输入多组第一滤波器,得到多个第一声学特征;其中,多组第一滤波器中每组第一滤波器的数量不同;将目标音频数据分别输入多组第二滤波器,得到多个第二声学特征;其中,多组第二滤波器中每组第二滤波器的数量不同;通过对多个第一声学特征进行卷积处理,得到第一音频特征;通过对多个第二声学特征进行卷积处理,得到第二音频特征。

15、在本技术实施例中,由于演奏音频数据和背景音频数据可能具备较高的相似度,因此为了将演奏音频数据与背景音频数据进行精准分割,使用不同数量的同类滤波器分别对目标音频数据进行处理,得到不同粒度的多个声学特征,从而提高演奏音频数据和背景音频数据分割的精准性。

16、结合第一方面和上述实现方式,在第一方面的某些实现方式中,上述通过对多个第二声学特征进行卷积处理,得到第二音频特征,包括:

17、通过对多个第二声学特征进行卷积处理与降维处理,得到第二音频特征。

18、在本技术实施例中,由于经过卷积处理后的第一音频特征和第二音频特征可能均为高维特征,而高维特征之间的比较以及计算比较复杂,且不容易调控。因此,通过对第二声学特征进行降维处理,可以降低特征之间比较的难度和数据的处理难度。

19、结合第一方面和上述实现方式,在第一方面的某些实现方式中,上述基于目标音频特征,得到演奏音频数据的评估结果,包括:

20、确定目标音频特征与预设噪音特征的相似度;若相似度小于预设相似阈值,基于目标音频特征与演奏音频数据对应的预设音频特征的相似度,生成评估结果。

21、在本技术实施例中,在目标音频特征与预设噪音特征的相似度小于预设相似阈值时,说明目标音频特征中不包括或者包括极少的噪音数据,并不会影响演奏音频数据的评估结果,可以确保评估结果的准确性。

22、结合第一方面和上述实现方式,在第一方面的某些实现方式中,上述获取目标音频数据,包括:

23、获取拾音设备采集的原始音频数据,原始音频数据包括原始演奏音频数据与原始背景音频数据;对原始音频数据进行预处理,生成目标音频数据;其中,预处理包括预加重处理、分帧处理和加窗处理中的一种或者多种。

24、在本技术实施例中,通过对原始音频数据进行预加重处理可以提升高频信号对应的频谱,使原始音频数据的频谱变得平坦,从而使得原始音频数据中的频谱更容易被提取;以及,对原始音频数据进行分帧处理和/或加窗处理可以消除原始音频数据中的边缘效应,从而确保目标音频数据短时平稳的特性,为后续得到目标音频特征做好准备,有利于提升获取目标音频特征的效率。

25、第二方面,提供了一种音频处理装置,该装置包括:

26、获取模块,用于获取目标音频数据,目标音频数据包括演奏音频数据与背景音频数据;第一处理模块,用于通过第一滤波器对目标音频数据进行处理,得到第一音频特征;通过第二滤波器对目标音频数据进行处理,得到第二音频特征;其中,第一滤波器的降噪性能优于第二滤波器的降噪性能;第二处理模块,用于基于第二音频特征对第一音频特征进行调整,得到目标音频特征;评估模块,用于基于目标音频特征,得到演奏音频数据的评估结果。

27、第三方面,提供一种电子设备,包括存储器和处理器。该存储器用于存储可执行程序代码,该处理器用于从存储器中调用并运行该可执行程序代码,使得该电子设备执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

28、第四方面,提供一种车辆,包括存储器和处理器。该存储器用于存储可执行程序代码,该处理器用于从存储器中调用并运行该可执行程序代码,使得该车辆执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

29、第五方面,提供了一种计算机程序产品,该计算机程序产品包括:计算机程序代码,当该计算机程序代码在计算机上运行时,使得该计算机执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

30、第六方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序代码,当该计算机程序代码在计算机上运行时,使得该计算机执行上述第一方面或第一方面任意一种可能的实现方式中的方法。

本文地址:https://www.jishuxx.com/zhuanli/20240618/23858.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。