技术新讯 > 乐器声学设备的制造及制作,分析技术 > 低功耗MFCC特征提取方法及装置与流程  >  正文

低功耗MFCC特征提取方法及装置与流程

  • 国知局
  • 2024-06-21 11:31:22

本发明涉及语音处理,特别涉及一种低功耗mfcc特征提取方法、一种低功耗mfcc特征提取装置和一种电子设备。

背景技术:

1、相关技术中,如图1所示,现有语音的梅尔频率倒谱系数(mfcc,mel frequencycepstrum coefficient)特征提取是将麦克风采集的语音时域信号经过adc转换为数字信号后,分别通过预加重、分帧、加窗、快速傅里叶变换、梅尔滤波、对数运算和离散余弦变换得到语音信号的特征值;其中,通过预加重、分帧及加窗模块增强被抑制的高频特征以及进行短时分析,通过快速傅里叶变换(fft,fast fourier transform)将时域语音信号转换到频域,并利用梅尔带通滤波对频域信号精简压缩,在各频段进行分析,最后进行对数运算和离散余弦变换,将各个频段的语音能量分布转换为语音mfcc特征;由于现有语音mfcc特征提取需要大规模电路的高频运算,且在运算过程中直接使用最大位宽进行计算,所以导致整体以及后处理模块功耗大,并容易出现位宽冗余,从而影响电路和系统的整体面积和功耗。

技术实现思路

1、本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本发明的一个目的在于提出一种低功耗mfcc特征提取方法,通过获取mfcc特征中的第一阶幅值并量化位宽,以及将位宽反馈到前级精准量化每一级运算的输入位宽,从而在保证识别准确率的前提下对数据位宽进行截断,从而降低运算功耗。

2、为达到上述目的,本发明第一方面实施例提出的一种低功耗mfcc特征提取方法,包括以下步骤:获取语音信号;采用不同的处理模块对所述语音信号进行预加重、分帧、加窗、快速傅里叶变换、梅尔滤波、对数运算和离散余弦变换处理,以得到所述语音信号对应的mfcc特征;获取所述mfcc特征中的第一阶幅值,并根据所述第一阶幅值生成对应的初始位宽,以便根据所述初始位宽对所述不同处理模块对应的位宽进行调整。

3、根据本发明实施例提出的低功耗mfcc特征提取方法,首先,获取语音信号;接着,采用不同的处理模块对语音信号进行预加重、分帧、加窗、快速傅里叶变换、梅尔滤波、对数运算和离散余弦变换处理,以得到语音信号对应的mfcc特征;最后,获取mfcc特征中的第一阶幅值,并根据第一阶幅值生成对应的初始位宽,以便根据初始位宽对不同处理模块对应的位宽进行调整;由此,通过获取mfcc特征中的第一阶幅值并量化位宽,以及将位宽反馈到前级精准量化每一级运算的输入位宽,从而在保证识别准确率的前提下对数据位宽进行截断,从而降低运算功耗。

4、另外,根据本发明实施例上述提出的低功耗mfcc特征提取方法还可以具有如下附加的技术特征:

5、可选地,还包括:根据所述第一阶幅值判断是否输出控制信号控制门控电路开启,以便延迟设备待机时间。

6、可选地,根据所述第一阶幅值生成对应的初始位宽,包括:判断所述第一阶幅值是否小于等于第一预设阈值,如果是,则设定初始位宽为第五预设阈值,如果否,则继续判断所述第一阶幅值是否小于等于第二预设阈值,如果是,则设定初始位宽为第六预设阈值;如果否,则继续判断所述第一阶幅值是否小于等于第三预设阈值,如果是,则设定初始位宽为第七预设阈值;如果否,则继续判断所述第一阶幅值是否小于等于第四预设阈值,如果是,则设定初始位宽为第八预设阈值。

7、进一步地,在获取所述mfcc特征中的第一阶幅值后,还判断所述第一阶幅值是否大于特征数据阈值,如果是,则清空计数器的计数值。

8、进一步地,所述第一预设阈值小于所述第二预设阈值,所述第二预设阈值小于所述第三预设阈值,所述第三预设阈值小于所述第四预设阈值;所述第五预设阈值小于所述第六预设阈值,所述第六预设阈值小于所述第七预设阈值,所述第七预设阈值小于所述第八预设阈值。

9、可选地,根据所述初始位宽对所述不同处理模块对应的位宽进行调整,包括:将所述初始位宽作为所述离散余弦变换的输入位宽,以便反馈至前级自适应调整不同处理模块对应的位宽。

10、可选地,根据所述第一阶幅值判断是否输出控制信号控制门控电路开启,包括:判断所述第一阶幅值是否小于等于所述特征数据阈值,如果是,则将计数器的计数值加一,并判断所述加一后的计数值是否大于等于第九预设阈值,如果是,则判断语音无效,并输出控制信号控制门控电路开启,并清空计数器的计数值。

11、为达到上述目的,本发明第二方面实施例提出了一种低功耗mfcc特征提取装置,包括获取模块,用于获取语音信号;特征提取模块,用于采用不同的处理模块对所述语音信号进行预加重、分帧、加窗、快速傅里叶变换、梅尔滤波、对数运算和离散余弦变换处理,以得到所述语音信号对应的mfcc特征;控制模块,用于获取所述mfcc特征中的第一阶幅值,并根据所述第一阶幅值生成对应的初始位宽,以便根据所述初始位宽对所述不同处理模块对应的位宽进行调整。

12、根据本发明实施例的低功耗mfcc特征提取装置,通过获取模块获取语音信号;特征提取模块采用不同的处理模块对语音信号进行预加重、分帧、加窗、快速傅里叶变换、梅尔滤波、对数运算和离散余弦变换处理,以得到语音信号对应的mfcc特征;控制模块获取mfcc特征中的第一阶幅值,并根据第一阶幅值生成对应的初始位宽,以便根据初始位宽对不同处理模块对应的位宽进行调整;由此,通过获取mfcc特征中的第一阶幅值并量化位宽,以及将位宽反馈到前级精准量化每一级运算的输入位宽,从而在保证识别准确率的前提下对数据位宽进行截断,从而降低运算功耗。

13、另外,根据本发明实施例上述提出的低功耗mfcc特征提取装置还可以具有如下附加的技术特征:

14、可选地,所述控制模块还用于,根据所述第一阶幅值判断是否输出控制信号控制门控电路开启,以便延迟设备待机时间。

15、为达到上述目的,本发明第三方面实施例提出了一种电子设备,包括处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上述的低功耗mfcc特征提取方法。

16、根据本发明实施例的电子设备,通过低功耗mfcc特征提取方法能够在保证识别准确率的前提下对数据位宽进行截断,从而降低运算功耗。

技术特征:

1.一种低功耗mfcc特征提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的低功耗mfcc特征提取方法,其特征在于,还包括:根据所述第一阶幅值判断是否输出控制信号控制门控电路开启,以便延迟设备待机时间。

3.根据权利要求2所述的低功耗mfcc特征提取方法,其特征在于,根据所述第一阶幅值生成对应的初始位宽,包括:

4.根据权利要求3所述的低功耗mfcc特征提取方法,其特征在于,在获取所述mfcc特征中的第一阶幅值后,还判断所述第一阶幅值是否大于特征数据阈值,如果是,则清空计数器的计数值。

5.根据权利要求4所述的低功耗mfcc特征提取方法,其特征在于,所述第一预设阈值小于所述第二预设阈值,所述第二预设阈值小于所述第三预设阈值,所述第三预设阈值小于所述第四预设阈值;所述第五预设阈值小于所述第六预设阈值,所述第六预设阈值小于所述第七预设阈值,所述第七预设阈值小于所述第八预设阈值。

6.根据权利要求5所述的低功耗mfcc特征提取方法,其特征在于,根据所述初始位宽对所述不同处理模块对应的位宽进行调整,包括:将所述初始位宽作为所述离散余弦变换的输入位宽,以便反馈至前级自适应调整不同处理模块对应的位宽。

7.根据权利要求6所述的低功耗mfcc特征提取方法,其特征在于,根据所述第一阶幅值判断是否输出控制信号控制门控电路开启,包括:

8.一种低功耗mfcc特征提取装置,其特征在于,包括:

9.根据权利要求8所述的低功耗mfcc特征提取装置,其特征在于,所述控制模块还用于,根据所述第一阶幅值判断是否输出控制信号控制门控电路开启,以便延迟设备待机时间。

10.一种电子设备,其特征在于,包括处理器、存储器和总线,其中,

技术总结本发明公开了一种低功耗MFCC特征提取方法及装置,其中,该方法包括获取语音信号;采用不同的处理模块对语音信号进行预加重、分帧、加窗、快速傅里叶变换、梅尔滤波、对数运算和离散余弦变换处理,以得到语音信号对应的MFCC特征;获取MFCC特征中的第一阶幅值,并根据第一阶幅值生成对应的初始位宽,以便根据初始位宽对不同处理模块对应的位宽进行调整;由此,通过获取MFCC特征中的第一阶幅值并量化位宽,以及将位宽反馈到前级精准量化每一级运算的输入位宽,从而在保证识别准确率的前提下对数据位宽进行截断,从而降低运算功耗。技术研发人员:何伊妮,曹国忠,张涌受保护的技术使用者:厦门半导体工业技术研发有限公司技术研发日:技术公布日:2024/3/4

本文地址:https://www.jishuxx.com/zhuanli/20240618/22030.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。