技术新讯 > 乐器声学设备的制造及制作,分析技术 > 阵列麦克风的语音变频采样方法及装置与流程 > 正文

阵列麦克风的语音变频采样方法及装置与流程

国知局
2024-06-21 11:39:35

本发明涉及麦克风语音采样，尤其涉及一种阵列麦克风的语音变频采样方法及装置。

背景技术：

1、语音增强技术是一种抑制语音中噪声，突出目标语音的技术，可以分为单麦克风语音增强技术和麦克风阵列语音增强技术，利用阵列麦克风采集语音是将语音转换为数字信号的技术，常用于音频录制及扩音等场合，从而实现对语音的保存及放大等效果。

2、当前主要是利用多颗数字硅麦按照一定的语音采样频率实现对语音数字信号的采集，然后再对采集的语音数字信号进行语音算法处理。但当前语音数字信号的采集方式并不能根据用户的语音变化调整语音数字信号的采样频率，因此当前语音数字信号的采样方式存在采样效果不佳的问题。

技术实现思路

1、本发明提供一种阵列麦克风的语音变频采样方法及装置，其主要目的在于解决当前语音数字信号的采样方式存在采样效果不佳的问题。

2、为实现上述目的，本发明提供的一种阵列麦克风的语音变频采样方法，包括：

3、获取当前语音帧，提取当前语音帧的当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图；

4、根据预设的谱图合并角将所述当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图合并为指标时序立体谱图，其中所述指标时序立体谱图共用同一原点，所述谱图合并角为180°；

5、在指标时序立体谱图中依次提取同一时刻的采样点数值集，将所述采样点数值集进行连接，得到语音指标时刻面集；

6、在所述语音指标时刻面集中依次提取相邻的语音指标时刻面，计算所述相邻的语音指标时刻面的指标面夹角，得到指标面夹角集；

7、计算所述指标面夹角集的指标面夹角方差，根据所述指标面夹角方差及预设的方差-采样频率公式计算当前语音帧的下一帧采样频率，其中所述方差-采样频率公式，如下所示：

8、

9、其中，f表示下一帧采样频率，s表示指标面夹角方差；

10、判断是否接收到语音停止采样指令；

11、若未接收到语音停止采样指令，则根据所述当前语音帧的下一帧采样频率采集下一语音帧；

12、计算所述下一语音帧的下一帧采样频率，利用所述下一语音帧及下一语音帧的下一帧采样频率分别更新所述当前语音帧及当前语音帧的下一帧采样频率，并返回上述判断是否接收到语音采样停止指令的步骤；

13、若接收到语音停止采样指令，则停止进行语音采样，完成阵列麦克风的语音变频采样。

14、可选地，所述获取当前语音帧，包括：

15、接收用户输入的语音输入场景；

16、根据所述语音输入场景在预构建的语音帧采样频率集中提取初始采样频率；

17、根据所述初始采样频率采集当前语音帧。

18、可选地，所述根据所述初始采样频率采集当前语音帧，包括：

19、根据所述初始采样频率，利用预构建的单位采样时长公式计算单位采样时长，其中所述单位采样时长公式，如下所示：

20、

21、其中，t表示单位采样时长，n表示单位帧采样点数，fstart表示初始采样频率；

22、接收数字信号，判断所述数字信号的信号时长是否达到所述单位采样时长；

23、若所述数字信号的信号时长未达到所述单位采样时长，则返回上述接收数字信号的步骤；

24、若所述数字信号的信号时长达到所述单位采样时长，则将所述数字信号作为当前语音帧。

25、可选地，所述提取当前语音帧的当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图，包括：

26、依次提取所述当前语音帧中每一个语音采样点的波幅及采样时间，得到当前语音波幅集及当前语音采样时间集；

27、建立所述当前语音波幅集与所述当前语音采样时间集的波幅时间对应关系，并根据所述波幅时间对应关系构建所述当前波幅时序谱图；

28、计算所述当前语音帧的频率，将所述当前语音帧的频率作为所述当前语音帧中每一个语音采样点的频率，得到当前语音频率集；

29、构建所述当前语音频率集与所述当前语音采样时间集的频率时间对应关系，并根据所述频率时间对应关系构建所述当前频率时序谱图；

30、计算每一个语音采样点的波幅与频率的比值，得到当前幅频比集；

31、构建所述当前幅频比集与所述当前语音采样时间集的幅频比时间对应关系，并根据所述幅频比时间对应关系构建所述当前幅频比时序谱图。

32、可选地，所述根据预设的谱图合并角将所述当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图合并为指标时序立体谱图，包括：

33、获取极坐标系，在所述极坐标系中分别取极角为0°极径、120°极径及240°极径，将所述0°极径、120°极径及240°极径作为时间轴；

34、获取所述极坐标系所在的极坐标面，提取所述极坐标系的极点，将所述极点作为立体谱图原点；

35、过所述立体谱图原点作所述极坐标面的面垂线，将所述面垂线作为波幅/频率/幅频比轴，得到待填充指标时序立体谱图；

36、将所述当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图填充至所述待填充指标时序立体谱图中，得到所述指标时序立体谱图。

37、可选地，所述在指标时序立体谱图中依次提取同一时刻的采样点数值集，包括：

38、提取所述指标时序立体谱图的当前语音采样时间集，在所述当前语音采样时间集中依次提取当前语音采样时间；

39、在所述指标时序立体谱图中提取所述当前语音采样时间对应的波幅坐标点、频率坐标点及幅频比坐标点，得到所述采样点数据集。

40、可选地，所述计算所述相邻的语音指标时刻面的指标面夹角，得到指标面夹角集，包括：

41、分别获取所述语音指标时刻面的面垂线，得到相邻的语音指标时刻面对应的面垂线对；

42、计算所述面垂线对的空间夹角，得到指标面垂线夹角；

43、根据预构建的指标面夹角公式，利用所述指标面垂线夹角计算所述指标面夹角，其中所述指标面夹角公式，如下所示：

44、α＝180°-β

45、其中，α表示指标面夹角，β表示指标面垂线夹角；

46、汇总所有相邻的语音指标时刻面的指标面夹角，得到所述指标面夹角集。

47、可选地，所述计算所述指标面夹角集的指标面夹角方差，包括：

48、利用预构建的方差公式，根据所述指标面夹角集计算所述指标面夹角方差，其中所述方差公式，如下所示：

49、

50、其中，s表示指标面夹角方差，α1表示所述指标面夹角集中的第一个指标面夹角，α2表示所述指标面夹角集中的第二个指标面夹角，αn-1表示所述指标面夹角集中的第n-1个指标面夹角，表示所述指标面夹角集的均值。

51、可选地，所述获取当前语音帧之后，所述方法还包括：

52、利用预构建的传输接口将所述当前语音帧传输至预构建的系统级芯片中，并提取所述系统级芯片的语音算法，其中，所述传输接口为pdm接口或iis接口，所述系统级芯片为soc芯片；

53、利用所述语音算法对所述当前语音帧进行算法处理，得到目标语音帧；

54、利用预构建的通讯芯片将所述目标语音帧传输至预构建的后端主机。

55、为了解决上述问题，本发明还提供一种阵列麦克风的语音变频采样装置，所述装置包括：

56、谱图提取模块，用于获取当前语音帧，提取当前语音帧的当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图；

57、指标时序立体谱图合并模块，用于根据预设的谱图合并角将所述当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图合并为指标时序立体谱图，其中所述指标时序立体谱图共用同一原点，所述谱图合并角为180°；

58、语音指标时刻面集获取模块，用于在指标时序立体谱图中依次提取同一时刻的采样点数值集，将所述采样点数值集进行连接，得到语音指标时刻面集；

59、下一帧采样频率计算模块，用于在所述语音指标时刻面集中依次提取相邻的语音指标时刻面，计算所述相邻的语音指标时刻面的指标面夹角，得到指标面夹角集；计算所述指标面夹角集的指标面夹角方差，根据所述指标面夹角方差及预设的方差-采样频率公式计算当前语音帧的下一帧采样频率，其中所述方差-采样频率公式，如下所示：

60、

61、其中，f表示下一帧采样频率，s表示指标面夹角方差；

62、语音循环采样模块，用于判断是否接收到语音停止采样指令；若未接收到语音停止采样指令，则根据所述当前语音帧的下一帧采样频率采集下一语音帧；计算所述下一语音帧的下一帧采样频率，利用所述下一语音帧及下一语音帧的下一帧采样频率分别更新所述当前语音帧及当前语音帧的下一帧采样频率，并返回上述判断是否接收到语音采样停止指令的步骤；若接收到语音停止采样指令，则停止进行语音采样。

63、为了解决上述问题，本发明还提供一种电子设备，所述电子设备包括：

64、至少一个处理器；以及，

65、与所述至少一个处理器通信连接的存储器；其中，

66、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以实现上述所述的阵列麦克风的语音变频采样方法。

67、为了解决上述问题，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现上述所述的阵列麦克风的语音变频采样方法。

68、诚如背景技术所述：当前语音数字信号的采样方式存在采样效果不佳的现象，首先需要根据当前语音帧的变化强度来决定当前语音帧的下一帧采样频率，在计算所述当前语音帧的变化强度时，需要获取当前语音帧，再提取当前语音帧的当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图，由于需要综合当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图的变化强度来决定所述当前语音帧的变化强度，因此需要将当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图组合至同一坐标系中，在组合时，根据预设的谱图合并角将所述当前波幅时序谱图、当前频率时序谱图及当前幅频比时序谱图合并为指标时序立体谱图，此时即可对当前语音帧进行综合分析，在进行分析时，先在指标时序立体谱图中依次提取同一时刻的采样点数值集，再将所述采样点数值集进行连接，得到语音指标时刻面集，由于所述采样点数值集为同一时刻的波幅、频率及幅频比，因此所述语音指标时刻面是由该时刻的波幅、频率以及幅频比组建的，语音指标时刻面即可表示某一时刻的语音特征，为了计算所述当前语音帧的连续性变化情况，此时需要在所述语音指标时刻面集中依次提取相邻的语音指标时刻面，计算所述相邻的语音指标时刻面的指标面夹角，得到指标面夹角集，再计算所述指标面夹角集的指标面夹角方差，最后根据所述指标面夹角方差及预设的方差-采样频率公式计算当前语音帧的下一帧采样频率，在计算出下一帧采样频率后，需要判断是否接收到语音停止采样指令，若未接收到语音停止采样指令，则继续根据所述当前语音帧的下一帧采样频率采集下一语音帧，再计算所述下一语音帧的下一帧采样频率，从而实现当前语音帧的持续采样，若接收到语音停止采样指令，则停止进行语音采样。因此本发明提出的阵列麦克风的语音变频采样方法可以解决当前语音数字信号的采样方式存在采样效果不佳的问题。