一种人声检测方法及语音特征提取电路
- 国知局
- 2024-06-21 11:57:22
本申请涉及语音处理,尤其涉及一种人声检测方法及语音特征提取电路。
背景技术:
1、语音活动检测(voice activity detection,vad)可以用于检测输入的语音信号是否包括人声,其一般可以包括语音特征提取和语音特征分类。现有技术提取语音特征采用梅尔频率倒谱系数(mel-frequency cepstral coefficient,mfcc)获得语音信号的时频图(spectrogram)进而获取语音特征,然而现有技术中实现mfcc方法的电路多采用滤波器组(filter bank),由于滤波器组需要大量主动放大器以及大电阻电容以处理低频信号,因此电路的功耗和面积都很大。
技术实现思路
1、本申请实施例的主要目的在于提出一种人声检测方法及语音特征提取电路,以降低语音特征提取电路的功耗和面积。
2、为实现上述目的,本申请实施例的一方面提出了一种人声检测方法,所述方法包括:
3、利用经过预先训练的时域神经网络提取语音信号的语音特征;其中,所述经过预先训练的时域神经网络应用于包括被动开关电容的语音特征提取电路;
4、对所述语音特征进行分类,得到分类结果;
5、根据所述分类结果判断所述语音信号是否包括人声。
6、在一些实施例中,所述利用经过预先训练的时域神经网络提取语音信号的语音特征,包括:
7、利用所述经过预先训练的时域神经网络对所述语音信号的每个信号帧采集多个采样信号;所述经过预先训练的时域神经网络的权重为根据稀疏化量化得到;
8、根据每个所述信号帧下的各个所述采样信号所累积的电荷确定每个所述信号帧下对应的所述语音特征。
9、在一些实施例中,所述对所述语音特征进行分类,得到分类结果,包括:
10、将所述语音特征输入到经过预先训练的二元神经网络,得到所述语音特征的所述分类结果。
11、在一些实施例中,所述分类结果包括多个所述语音特征对应的分类值;
12、所述根据所述分类结果判断所述语音信号是否包括人声,包括:
13、若所述分类结果包括连续且超过设定数量的所述分类值对应为人声特征,则将所述语音信号确定为包括人声。
14、为实现上述目的,本申请实施例的另一方面提出了一种语音特征提取电路,应用于前述的一种人声检测方法,所述电路包括:放大器、多个特征运算电路以及比较器;
15、其中,所述放大器的输出端与各个所述特征运算电路的输入端连接,各个所述特征运算电路的输出端与所述比较器的输入端连接;
16、所述放大器,用于将语音信号放大并将放大后的所述语音信号输入至各个所述特征运算电路;
17、所述特征运算电路,用于从放大后的所述语音信号采集得到采样信号,并利用被动开关电容根据所述采样信号输出对应的电荷;
18、所述比较器,用于根据各个所述电荷输出所述语音信号对应的语音特征。
19、在一些实施例中,每个所述特征运算电路包括模拟记忆电路和稀疏运算电路;
20、所述模拟记忆电路,用于存储所述采样信号;
21、所述稀疏运算电路,用于根据所述采样信号及其对应的权重确定所述被动开关电容的导通数量,并输出所述被动开关电容累积的电荷。
22、在一些实施例中,所述稀疏运算电路包括共源缓冲电路、多个电容阵列以及权重运算电路;其中,每个所述电容阵列包括多个被动开关电容;
23、所述共源缓冲电路,用于对各个所述电容阵列充电;
24、所述权重运算电路,用于根据所述采样信号对应的权重判断是否交换所述电容阵列的正负端信号。
25、为实现上述目的,本申请实施例的另一方面提出了一种人声检测装置,所述装置包括:
26、特征提取单元,用于利用经过预先训练的时域神经网络提取语音信号的语音特征;其中,所述经过预先训练的时域神经网络应用于包括被动开关电容的语音特征提取电路;
27、特征分类单元,用于对所述语音特征进行分类,得到分类结果;
28、人声检测单元,用于根据所述分类结果判断所述语音信号是否包括人声。
29、为实现上述目的,本申请实施例的另一方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
30、为实现上述目的,本申请实施例的另一方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
31、本申请实施例至少包括以下有益效果:
32、本申请在包括被动开关电容的语音特征提取电路上部署经过预先训练的时域神经网络,利用经过预先训练的时域神经网络提取语音信号的语音特征;对语音特征进行分类,得到分类结果;根据分类结果判断语音信号是否包括人声。本申请的语音特征提取电路采样被动开关电容电实现时域神经网络运算,无需利用大量主动放大器和大电阻电容,降低了电路面积,因此本申请的人声检测方法利用时域神经网络在该语音特征提取电路上进行特征提取,相较于现有技术采用梅尔频率倒谱系数获取语音特征而言,极大降低了功耗。
技术特征:1.一种人声检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种人声检测方法,其特征在于,所述利用经过预先训练的时域神经网络提取语音信号的语音特征,包括:
3.根据权利要求1所述的一种人声检测方法,其特征在于,所述对所述语音特征进行分类,得到分类结果,包括:
4.根据权利要求1所述的一种人声检测方法,其特征在于,所述分类结果包括多个所述语音特征对应的分类值;
5.一种语音特征提取电路,其特征在于,应用于如权利要求1所述的一种人声检测方法,所述电路包括:放大器、多个特征运算电路以及比较器;
6.根据权利要求5所述的一种语音特征提取电路,其特征在于,每个所述特征运算电路包括模拟记忆电路和稀疏运算电路;
7.根据权利要求6所述的一种语音特征提取电路,其特征在于,所述稀疏运算电路包括共源缓冲电路、多个电容阵列以及权重运算电路;其中,每个所述电容阵列包括多个被动开关电容;
8.一种人声检测装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的方法。
技术总结本申请公开了一种人声检测方法及语音特征提取电路,方法包括:在包括被动开关电容的语音特征提取电路上部署经过预先训练的时域神经网络,利用经过预先训练的时域神经网络提取语音信号的语音特征;对语音特征进行分类,得到分类结果;根据分类结果判断语音信号是否包括人声。本申请的语音特征提取电路采样被动开关电容电实现时域神经网络运算,无需利用大量主动放大器和大电阻电容,降低了电路面积,因此本申请的人声检测方法利用时域神经网络在该语音特征提取电路上进行特征提取,相较于现有技术采用梅尔频率倒谱系数获取语音特征而言,极大降低了功耗,可广泛应用于语音处理技术领域。技术研发人员:阮家辉,于维翰,麦沛然,马许愿受保护的技术使用者:澳门大学技术研发日:技术公布日:2024/6/11本文地址:https://www.jishuxx.com/zhuanli/20240618/24707.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表