一种泛音列提取方法及相关装置
- 国知局
- 2024-06-21 10:41:06
本发明涉及音色特征提取,尤其涉及一种泛音列提取方法及相关装置。
背景技术:
1、音色是声音的特色,声音的感觉特性,是音频的品质特征;能够将音高、音强和音长都相同的两个音区别开来的一种声音的属性。音色主要由频谱特征决定。
2、现有技术中,对音色的特征提取并没有一个十分完善的算法,大多数都是滤波后进行傅里叶变换,对得到了的频域信号进行形状的感知,运用一些参数,例如谐波谱质心、谐波谱偏差、谐波谱伸展、谐波谱波动、谱质心、谱滚降、谐波能量比、谐度、偶次谐波含量、奇次谐波含量和谐波的三色激励参数等,由于其中包含有噪声等干扰因素,因此,这些参数特征并不能够完备的表示音色的本质。
3、然而,音色之所以有不同,是因为它们发出的声音,除了一个基音外,还有许多不同频率的泛音列伴随频域中展现,泛音列包含了该声音的所有音色特征,泛音列之间存在一定的倍数关系,不同的泛音列作用域人的听觉系统,人耳对这些泛音列进行分析,最后在大脑中生成不同音色的感觉,使人能够辨别出不同的声音。因此,提取泛音列就显得尤为重要,而现阶段并没有一个十分完善的泛音列提取方法。
技术实现思路
1、有鉴于此,本发明提供了一种泛音列提取方法及相关装置,用于解决现有技术中对音色的特征提取并没有一个十分完善的算法,大多数都是滤波后进行傅里叶变换,对得到了的频域信号进行形状的感知,运用一些参数,例如谐波谱质心、谐波谱偏差、谐波谱伸展、谐波谱波动、谱质心、谱滚降、谐波能量比、谐度、偶次谐波含量、奇次谐波含量和谐波的三色激励参数等,由于其中包含有噪声等干扰因素,因此,这些参数特征并不能够完备的表示音色的本质的问题。具体方案如下:
2、一种泛音列提取方法,包括:
3、将音频信号转换为频域数字信号,其中,所述频域数字信号包括:多帧子频域数字信号;
4、依据预设的筛选规则将每帧子频域数字信号进行凸峰筛选,得到各个初始泛音列;
5、计算每个初始泛音列的基频,基于所述基频确定对应初始泛音列的最终泛音列;
6、对各个最终泛音列按照时间顺序进行排列,得到所述音频信号的目标泛音列。
7、上述的方法,可选的,将音频信号转换为频域数字信号,包括:
8、在时域内,将所述音频信号转换为模拟信号,将所述模拟信号转换为时域数字信号;
9、将所述时域数字信号依据预设时长进行分帧操作,得到多帧子时域数字信号;
10、对每帧子时域数字信号进行短时傅里叶变换,得到多帧子频域数字信号,其中,所述多帧子频域数据信号组成所述频域数字信号。
11、上述的方法,可选的,依据预设的筛选规则将每帧子频域数字信号进行凸峰筛选,得到各个初始泛音列,包括:
12、针对每帧子频域信号中的每个频率点,计算其在预设频率范围的均值,若当前频率点强度值大于所述均值的预设倍数且大于当前帧子频域信号中的最大强度值的预设比例,将所述当前频率点作为预选凸峰点;
13、对各个预选凸峰点进行筛选,得到各个实际凸峰点;
14、将所述各个实际凸峰点与预设凸峰值阈值进行比较,将小于所述预设凸峰值阈值的实际凸峰点置0,在满足预设数量要求的情况下,保留大于所述预设凸峰点阈值的实际凸峰点,得到各个初始泛音列。
15、上述的方法,可选的,对各个预选凸峰点进行筛选,得到各个实际凸峰点,包括:
16、对各个预设凸峰点依据频率值进行排序;
17、依据排序结果,遍历所述各个预设凸峰点,若当前预选凸峰点的与上一预选凸峰点的频率差大于预设频率阈值,则所述当前预选凸峰点为实际凸峰点;
18、若当前预选凸峰点的与上一预选凸峰点的频率差小于预设频率阈值,若所述当前预选凸峰点的强度值大于所述上一预选凸峰点的强度值,将所述上一预选凸峰点的强度值置0,将所述当前凸峰点作为实际凸峰点,若所述当前预选凸峰点的强度值小于所述上一预选凸峰点的强度值,将所述当前预选凸峰点的强度值置0,将所述上一预选凸峰点作为实际凸峰点。
19、上述的方法,可选的,计算每个初始泛音列的基频,基于所述基频确定对应初始泛音列的最终泛音列,包括:
20、针对每个初始泛音列确定其中各个实际凸峰点频率的最大公约数,将所述最大公约数作为其对应的基频;
21、在预设误差范围内,当前初始泛音列的基频按照预设倍数递增,得到各个递增基频;
22、依据所述各个递增基频提取与所述当前初始泛音列对应的当前子频域数据信号,得到最终泛音列。
23、一种泛音列提取装置,包括:
24、转换模块,用于将音频信号转换为频域数字信号,其中,所述频域数字信号包括:多帧子频域数字信号;
25、筛选模块,用于依据预设的筛选规则将每帧子频域数字信号进行凸峰筛选,得到各个初始泛音列;
26、计算和确定模块,用于计算每个初始泛音列的基频,基于所述基频确定对应初始泛音列的最终泛音列;
27、排序模块,用于对各个最终泛音列按照时间顺序进行排列,得到所述音频信号的目标泛音列。
28、上述的装置,可选的,所述转换模块包括:
29、转换单元,用于在时域内,将所述音频信号转换为模拟信号,将所述模拟信号转换为时域数字信号;
30、分帧单元,用于将所述时域数字信号依据预设时长进行分帧操作,得到多帧子时域数字信号;
31、变换单元,用于对每帧子时域数字信号进行短时傅里叶变换,得到多帧子频域数字信号,其中,所述多帧子频域数据信号组成所述频域数字信号。
32、上述的装置,可选的,所述筛选模块包括:
33、计算和预选单元,用于针对每帧子频域信号中的每个频率点,计算其在预设频率范围的均值,若当前频率点强度值大于所述均值的预设倍数且大于当前帧子频域信号中的最大强度值的预设比例,将所述当前频率点作为预选凸峰点;
34、筛选单元,用于对各个预选凸峰点进行筛选,得到各个实际凸峰点;
35、比较单元,用于将所述各个实际凸峰点与预设凸峰值阈值进行比较,将小于所述预设凸峰值阈值的实际凸峰点置0,在满足预设数量要求的情况下,保留大于所述预设凸峰点阈值的实际凸峰点,得到各个初始泛音列。
36、上述的装置,可选的,所述筛选模块包括:
37、排序单元,用于对各个预设凸峰点依据频率值进行排序;
38、第一确定单元,用于依据排序结果,遍历所述各个预设凸峰点,若当前预选凸峰点的与上一预选凸峰点的频率差大于预设频率阈值,则所述当前预选凸峰点为实际凸峰点;
39、第二确定单元,用于若当前预选凸峰点的与上一预选凸峰点的频率差小于预设频率阈值,若所述当前预选凸峰点的强度值大于所述上一预选凸峰点的强度值,将所述上一预选凸峰点的强度值置0,将所述当前凸峰点作为实际凸峰点,若所述当前预选凸峰点的强度值小于所述上一预选凸峰点的强度值,将所述当前预选凸峰点的强度值置0,将所述上一预选凸峰点作为实际凸峰点。
40、上述的装置,可选的,所述计算和确定模块包括:
41、第三确定单元,用于针对每个初始泛音列确定其中各个实际凸峰点频率的最大公约数,将所述最大公约数作为其对应的基频;
42、递增单元,用于在预设误差范围内,当前初始泛音列的基频按照预设倍数递增,得到各个递增基频;
43、提取单元,用于依据所述各个递增基频提取与所述当前初始泛音列对应的当前子频域数据信号,得到最终泛音列。
44、一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述的泛音列提取方法。
45、一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的泛音列提取方法。
46、与现有技术相比,本发明包括以下优点:
47、本发明公开了一种泛音列提取方法及相关装置,包括:将音频信号转换为频域数字信号,其中,频域数字信号包括:多帧子频域数字信号;依据预设的筛选规则将每帧子频域数字信号进行凸峰筛选,得到各个初始泛音列;计算每个初始泛音列的基频,基于基频确定对应初始泛音列的最终泛音列;对各个最终泛音列按照时间顺序进行排列,得到音频信号的目标泛音列。上述过程中,通过对音频信号进行转换和凸峰筛选得到各个初始泛音列,计算每个初始泛音列的基频,基于各个基频确定最终泛音列,基于各个最终泛音列确定目标泛音列,上述过程对干扰因素进行了滤除,得到了目标泛音列,由于泛音列包含了该音频信号的所有音色特征,因此,能够完备的表示音色的本质。
本文地址:https://www.jishuxx.com/zhuanli/20240618/21191.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表