技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种航天用语音交互设备用噪声抑制方法及系统与流程 > 正文

一种航天用语音交互设备用噪声抑制方法及系统与流程

国知局
2024-06-21 11:58:07

本发明属于航天语音交互，更具体地说，涉及一种航天用语音交互设备用噪声抑制方法及系统。

背景技术：

1、在现代航天任务中，语音交互设备扮演着越来越重要的角色，为航天员提供语音通信、语音识别等各种语音交互服务，满足目前越来越复杂、精细和智能化的航天任务需求。受限于航天器舱内设备和材料，如今航天员所处的工作环境仍然存在较大的噪声。其主要来源于航天器内部各种设备和仪器，如通风系统、水循环系统、电力系统等。这些设备为航天员提供必要的生命支持，或维持日常的工作条件，一般都需要持续不停地运转，因而航天员工作时不得不面对复杂噪声环境的影响。噪音会对航天用语音交互系统造成非常大的影响，无论是语音通信的质量还是语音识别的识别率都和环境噪声的情况息息相关。考虑到航天应用中高可靠性高鲁棒性的特殊要求，为了有效应对航天器舱内复杂噪声环境对语音交互性能的制约，航天器中的话音处理器必需具备噪声抑制能力，集成针对航天器舱内环境的有效噪声抑制技术。

2、尽管采用麦克风阵列进行话音采集可以获得更好的噪声抑制效果，然而，由于在航天器内需要兼容耳麦、手机等多种话音设备，无法排除单通道话音采集装置，因而在天空话音处理器中显然也需要集成单通道噪声抑制技术。考虑到话音处理器计算资源严重受限的特点，以及在实际应用中单通道噪声抑制方法性能往往不太理想等问题，目前急需提出面向航天器舱内环境的低计算开销高性能单通道噪声抑制技术。

3、针对上述问题也进行了相应的改进，如中国专利申请号cn202010658686.9，公开日为2020年10月13日，该专利公开了一种语音信号的噪声抑制方法、装置、设备及存储介质，涉及音频处理技术领域。所述方法包括：获取带噪语音信号的特征数据；对特征数据进行变换处理，得到变换后的特征数据；对特征数据和变换后的特征数据进行两步递归处理，得到递归处理后数据；根据递归处理后数据生成增益信息；基于增益信息对带噪语音信号进行噪声抑制处理，得到降噪语音信号。该专利的不足之处在于：数据多重处理，成本高且效率慢。

4、又如中国专利申请号cn202011133182.1，公开日为2022年4月22日，该专利公开了一种噪声抑制参数处理方法、装置及计算机设备，包括：获取当前帧待处理语音信号的当前帧噪声抑制因子以及前一帧已处理语音信号的前一帧噪声抑制因子；根据所述前一帧噪声抑制因子对所述当前帧噪声抑制因子进行时域平滑处理，得到时域当前帧噪声抑制因子；对所述时域当前帧噪声抑制因子进行频域平滑处理，得到目标当前帧噪声抑制因子。该专利的不足之处在于：数据前后关联性强，容易出现失误的情况，导致整体效果一般。

技术实现思路

1、1、要解决的问题

2、针对现有航天语音交互噪声大且质量差的问题，本发明提供一种航天用语音交互设备用噪声抑制方法及系统。本发明在仅占有少量计算资源的条件下，能有效地降低航天器舱内复杂环境噪声环境对语音交互系统的影响，达到改善话音质量提升语音处理性能的目的；整个方法操作简单，易于实现。

3、2、技术方案

4、为解决上述问题，本发明采用如下的技术方案。

5、一种航天用语音交互设备用噪声抑制方法，包括以下步骤：

6、s1：对带噪语音进行采样和预处理；

7、s2：对预处理后的带噪语音进行求取幅度谱和相位谱，再求取功率谱，最终得到噪声的平均功率谱以及它的平均幅度；

8、s3：使用基于mfcc距离的自适应端点检测方法区分说话帧和静音帧，静音帧用于修改估计噪声的功率谱和幅度谱；说话帧用于计算该帧的传递函数；

9、s4：基于连续的静音帧，计算其mfcc声学表示的一阶统计量，根据滤波器参数修正规则对滤波器参数进行修正，得到修正后的维纳滤波器；

10、s5：计算出修正后的维纳滤波器的输出；

11、s6：对步骤s2中的幅度谱和相位谱作傅里叶逆变换，将语音从频域重新恢复到时域。

12、更进一步的，所述步骤s3中基于mfcc距离的自适应端点检测方法具体包括如下步骤：

13、s31：用多窗谱减法对强噪声下的语音进行初步去噪；

14、s32：对初步去噪后的语音信号提取mfcc参数；

15、s33：求取mfcc倒谱距离；

16、s34：将mfcc倒谱距离作为特征来进行语音端点检测。

17、更进一步的，所述多窗谱减法包括如下步骤：

18、s311：对带噪语音进行采样，采样后得到语音信号，接着进行加窗分帧预处理；

19、s312：进行多窗谱功率谱估算；

20、s313：对相邻帧进行平滑处理；

21、s314：计算出噪声的平均功率谱密度；

22、s315：计算谱减增益因子；

23、s316：得到增强语音幅度谱。

24、更进一步的，所述步骤s32中提取mfcc参数具体包括如下步骤：

25、s321：对语音信号进行预加重、分帧、加窗预处理；

26、s322：对预处理后的语音信号进行快速傅里叶变换；

27、s323：对语音信号求能量谱得到谱线能量；

28、s324：将每帧的能量谱经过mel滤波器，并计算在mel滤波器中的能量，即将每帧的能量谱和滤波器的频率响应求积再求和；

29、s325：把mel滤波器的能量取对数后求得的值计算dct倒谱从而得到mfcc参数。

30、更进一步的，所述步骤s33中mfcc倒谱距离即通过比较各帧信号的mfcc系数和无话帧的mfcc倒谱系数之间的距离，然后和阈值作比较来实现的。

31、更进一步的，所述步骤s4中滤波器参数进行修正的具体过程包括如下步骤：

32、s41：计算周边连续的静音帧的mfcc倒谱特征，并计算它们的均值和方差；

33、s42：将这些静音帧的一阶统计量作为输入至查表分类器进行分类决策，所确定的类别编号即为相应的滤波器参数修正表中的表项编号；

34、s43：取出滤波器参数修正表项中存储的滤波器参数修正值，并对滤波器进行修正。

35、更进一步的，所述步骤s1中对带噪语音进行采样后得到语音信号，对语音信号进行加窗分帧预处理；步骤s2中对语音信号进行fft变换得到幅度谱和相位谱；并利用前导nis帧无话段得到噪声的平均功率谱以及它的平均幅度。

36、一种航天用语音交互设备用噪声抑制系统，包括：

37、麦克风：用于产生带噪语音；

38、数模转换子模块：用于将采集到的带噪语音进行转化；

39、算法处理控制子模块：用于执行如上述任一项所述的航天用语音交互设备用噪声抑制方法；

40、电源子模块：用于给麦克风、数模转换子模块以及算法处理控制子模块进行供电。

41、3、有益效果

42、相比于现有技术，本发明的有益效果为：

43、本发明通过采用基于mfcc距离的自适应端点检测方法对说话帧与静音帧进行区分，把这种精度较高的检测方法用到维纳滤波的检测环节，以其更清晰地区分出说话帧和无话帧，从而使噪声的估计更为精准；且其能够根据不同背景噪声环境自适应地调整阈值以确保复杂环境低信噪比情况下保证一定的语音端点检测精度；同时利用滤波器参数修正规则对滤波器参数进行修正实现噪声抑制以得到更高质量的降噪语音；整个方法在单通道声音采集过程中，在仅占有少量计算资源的条件下，能有效地降低航天器舱内复杂环境噪声环境对语音交互系统的影响，达到改善话音质量提升语音处理性能的目的。