技术新讯 > 乐器声学设备的制造及制作,分析技术 > 吹气声检测方法、计算机设备及计算机存储介质与流程  >  正文

吹气声检测方法、计算机设备及计算机存储介质与流程

  • 国知局
  • 2024-08-08 17:01:33

本申请实施例涉及音频处理领域,具体涉及一种吹气声检测方法、计算机设备及计算机存储介质。

背景技术:

1、吹气声检测在应用程序开发和使用的领域中具有较多的应用场景,例如在一些人机交互场景或者用户与应用程序进行游戏互动的场景,或者在音频质量检测场景,都需要对人呼出的吹气声进行检测,以识别出用户的动作或者指令。

2、由于吹气声检测存在上述多种应用场景,因而亟需提出一种能够准确识别和检测用户是否呼出吹气声的方法。

技术实现思路

1、本申请实施例提供了一种吹气声检测方法、计算机设备及计算机存储介质,用于准确识别出音频数据是否具有吹气声特征,提升吹气声检测的准确性和可靠性。

2、本申请实施例第一方面提供了一种吹气声检测方法,所述方法包括:

3、获取待处理音频数据的多个音频帧,对每个所述音频帧进行傅里叶变换,得到每个所述音频帧对应的频谱;

4、对于每个所述音频帧,根据该音频帧的频谱确定该音频帧中吹气声频段的频段能量,以及根据该音频帧的频谱确定该音频帧的总能量,并计算所述频段能量在所述总能量中的占比;

5、对于每个所述音频帧,计算该音频帧与其前一个音频帧之间的相关系数;

6、对于每个所述音频帧,若该音频帧的所述频段能量大于频段能量阈值、所述占比大于预设的占比阈值且所述相关系数小于相关系数阈值,则确定该音频帧为对应于吹气声的音频帧。

7、本申请实施例第二方面提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现前述第一方面的方法。

8、本申请实施例第三方面提供了一种计算机存储介质,计算机存储介质中存储有指令,该指令在计算机上执行时,使得计算机执行前述第一方面的方法。

9、本申请实施例第四方面提供了一种计算机程序产品,所述计算机程序产品在计算机设备上运行时,使得所述计算机设备执行前述第一方面的方法。

10、从以上技术方案可以看出,本申请实施例具有以下优点:

11、计算机设备对待处理音频数据的每个音频帧进行傅里叶变换,得到每个音频帧对应的频谱,对于每个音频帧,根据该音频帧的频谱确定该音频帧中吹气声频段的频段能量,以及根据该音频帧的频谱确定该音频帧的总能量,并计算频段能量在总能量中的占比,计算该音频帧与其前一个音频帧之间的相关系数,若该音频帧的频段能量大于频段能量阈值、占比大于预设的占比阈值且相关系数小于相关系数阈值,则确定该音频帧为对应于吹气声的音频帧。由于音频帧的吹气声频段能量与音频帧之间的相关系数等指标与吹气声的声学特征紧密关联,因而根据上述多种指标检测吹气声的方式更加准确,可以准确地识别出音频数据是否具有吹气声特征,提升吹气声检测的准确性和可靠性。

技术特征:

1.一种吹气声检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述频段能量阈值包括第一频段能量阈值;对应于吹气声的音频帧包括第一吹气声音频帧,所述第一吹气声音频帧为所述频段能量大于所述第一频段能量阈值、所述占比大于所述占比阈值且所述相关系数小于所述相关系数阈值的音频帧;

3.根据权利要求2所述的方法,其特征在于,所述频段能量阈值还包括第二频段能量阈值,所述第二频段能量阈值大于所述第一频段能量阈值;

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述频段能量阈值包括第一频段能量阈值和第二频段能量阈值,所述第二频段能量阈值大于所述第一频段能量阈值;所述初始状态包括所述虚拟标志图形的初始位置和/或所述虚拟标志图形的初始形状;

7.根据权利要求6所述的方法,其特征在于,所述将所述虚拟标志图形的所述初始状态调整为目标状态,包括:

8.根据权利要求1至7任一项所述的方法,其特征在于,所述根据该音频帧的频谱确定该音频帧中吹气声频段的频段能量,包括:

9.根据权利要求1至7任一项所述的方法,其特征在于,所述计算该音频帧与其前一个音频帧之间的相关系数,包括:

10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至9中任一项所述的方法。

11.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有指令,所述指令在计算机上执行时,使得所述计算机执行如权利要求1至9中任一项所述的方法。

技术总结本申请实施例公开了一种吹气声检测方法、计算机设备及计算机存储介质。对于待处理音频数据的每个音频帧,根据该音频帧的频谱确定该音频帧中吹气声频段的频段能量,以及根据该音频帧的频谱确定该音频帧的总能量,并计算频段能量在总能量中的占比,计算该音频帧与其前一个音频帧之间的相关系数,若该音频帧的频段能量大于频段能量阈值、占比大于预设的占比阈值且相关系数小于相关系数阈值,则确定该音频帧为对应于吹气声的音频帧。由于音频帧的吹气声频段能量与音频帧之间的相关系数等指标与吹气声的声学特征紧密关联,因而根据上述多种指标检测吹气声的方式更加准确,可准确地识别出音频数据是否具有吹气声特征,提升吹气声检测的准确性和可靠性。技术研发人员:陈洲旋受保护的技术使用者:腾讯音乐娱乐科技(深圳)有限公司技术研发日:技术公布日:2024/8/5

本文地址:https://www.jishuxx.com/zhuanli/20240808/271882.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。