技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种管制话音数据有效信息增强方法及系统与流程  >  正文

一种管制话音数据有效信息增强方法及系统与流程

  • 国知局
  • 2024-06-21 11:31:33

本发明涉及语音信号处理,具体涉及一种管制话音数据有效信息增强方法及系统。

背景技术:

1、传统的航空管制方法依赖于管制员与飞行员之间的口头通信。这种方法受到了很多限制,例如人为错误、多人话音的交织、通讯干扰等,这都可能影响到航空安全。此外,随着航空交通的增长,人工管制所能处理的航班数量已经达到了极限。

2、近年来,随着人工智能和机器学习技术的飞速发展,这些技术在很多领域都取得了显著的突破,其中之一就是语音识别。现代语音识别技术可以实现高准确率的语音转文本,这为其在航空管制系统中的应用提供了可能性。利用这种技术,可以帮助管制员更高效地处理通讯任务,减少错误并提高系统的整体效率。

3、然而,航空管制系统中的语音识别面临的挑战与其他应用领域有所不同。在此背景下,智能航空管制系统需求日益迫切,其中一个关键的技术就是高效、准确的管制话音信号处理技术。这需要对输入的语音信号进行高质量的预处理,以确保后续的语音识别过程顺利进行,并最终实现智能化的管制操作,然而,当前的语音识别技术在应用于航空管制场景时仍然面临着多人同时说话、弱有效信号难以识别、以及背景噪声干扰等问题,导致识别率受到限制。

技术实现思路

1、本发明所要解决的技术问题是如何实现多人话音信号的分离以及对信号进行降噪和有效信息的增强,目的在于提供一种管制话音数据有效信息增强方法及系统,实现了对话音信号的分离、降噪和增强。

2、本发明通过下述技术方案实现:

3、一种管制话音数据有效信息增强方法,步骤依次包括:管制话音信号分离,管制话音信号降噪和管制话音信号增强;

4、管制话音信号分离的具体方法包括:

5、第一步,获取管制话音信号;

6、第二步,识别交织信号段;

7、第三步,建立前序信号预测模型;

8、第四步,预测前序信号在交织段的可能状态;

9、第五步,从交织段中分离与前序信号一致的信号,输出完整信号;

10、第六步,将交织段剩余信号与后续信号拼接,并判断拼接后的信号是否存在交织段,若无交织段,则将拼接后的信号作为有效信号输出;若有交织段,则跳转至第二步。

11、具体地,第二步中识别交织信号段的方法包括:

12、a1、构建输入的管制话音信号相对于时间t的相位变化数学模型:s(t)=m(t)cos(wt+a),其中,m为通讯基带信号,w为标准通话频率,a为相对于基带信号的频率抖动;

13、a2、设定采样间隔,并按照采样间隔对管制话音信号进行采样;

14、a3、选取采样点tk及其下一采样点tk+1,并获取对应的信号模型s(tk)和s(tk+1);

15、a4、设定相位突变阈值t,并通过|s(tk)-s(tk+1)|>t判断是否发生相位突变,若未发生相位突变,则返回至步骤a3;若发生相位突变,则记录突变位置,并令突变位置数量+1;

16、a5、判断突变位置数量是否为2,若为否,则返回至步骤a3;若为是,则将两个突变位置之间的管制话音信号段标记为交织段;

17、a6、重置突变位置数量为0,并判断是否对所有采样点完成检测,若未完成则跳转至步骤a3;若完成则结束。

18、具体地,第三步中建立前序信号预测模型的方法包括:

19、b1、获取交织信号段的前序非交织信号;

20、b2、基于标准通讯频率w计算各采样位置的标准频差δwi和相差δφi;

21、b3、通过数学建模分析,建立标准频差的拟合函数w(i)和相差的拟合函数φ(i);

22、b4、建立前序信号预测模型:其中,i为预测位置时间t相对建立模型开始时刻的采样数;

23、b5、建立前序信号在交织段的预测模型:其中,φ0为管制话音信号相对于标准通信信号的相位;

24、具体地,第五步中从交织段中分离与前序信号一致的信号的方法包括:

25、c1、计算t1时刻对应的采样数i1和t2时刻对应的采样数i2,其中,t1为交织开始的时间,t2为交织结束的时间,i为t1到t2之间的时间点t相对于前序模型建立起始时间t0之间的采样次数;

26、c2、按照顺序取采样位置k,获取k处的预测信号phase(k);

27、c3、从有效信号在k处的采样值v(k)中分离预测信号,其中,为分离后的剩余信号,γ(k)为分离计算函数;

28、c4、判断的有效性,若为有效信号则跳转至c5;若为无效信号则跳转至c6;

29、c5、将phase(k)纳入有效分离音频信号,将纳入待处理信号,并跳转步骤c7;

30、c6、将前序信号和有效音频信号拼接并输出,将待处理信号与剩余未分离交织信号及后续无交织信号拼接输出,完成分离;

31、c7、判断交织段是否完成处理,若未完成则跳转步骤c2;若以完成则将前序信号和有效分离音频信号拼接输出,将代处理信号与后续无交织信号拼接输出,完成分离;

32、其中,拼接输出的前序信号和有效分离信号为有效信号。

33、可选地,管制话音信号降噪的方法包括:

34、步骤一,获取有效信号,并对有效信号进行分帧采样;

35、步骤二,获取采样点集,并获得异常点集和正常点集;

36、步骤三,对正常点集和异常点集进行傅里叶变换;

37、步骤四,通过计算点集方差表示噪声谱;

38、步骤五,进行逆傅里叶变换获得去噪后的语音信号。

39、具体地,步骤一的具体方法包括:

40、s1、获取有效信号s,时间长度为ts;

41、s2、对有效信号数据频率进行分帧采样,获取时间t与频率f(t)构成的采样点集f={f(t),t|0<t<ts};

42、步骤二的具体方法包括:

43、s3、采用局部离群因子算法,从集合f中识别异常点集e,e∈f;

44、s4、获取正常点集g=f-e;

45、步骤三的具体方法包括:

46、s5、对异常点集中的每个点对应的时间te计算s在对应帧的傅里叶变换γ(te);

47、s6、对正常点集中的每个点对应的时间tg计算s在对应帧的傅里叶变换γ(tg);

48、步骤四的具体方法包括:

49、s7、计算正常点集对应的傅里叶变换结果的频率上限γu和频率下限γd;

50、s8、计算获取噪声信号:

51、s9、计算噪声信号的方差:其中,n为异常点集e的数量,δj为第j个点对应的差;

52、步骤五的具体方法包括:

53、s10、基于谱减法理论,获得修正后的信号谱其中,yω为有效信号s的傅里叶变换,w为有效信号的采样帧,α为过减因子,β为谱下限参数;

54、s11、从有效信号s中获取语音相位值,并通过修正后的信号谱进行逆傅里叶变换获得去噪后的语音信号。

55、可选地,管制话音信号增强的方法包括:

56、s1、获取去噪后的管制话音数据;

57、s2、通过离散小波变换,对噪后的管制话音数据离散化,形成多尺度分解;

58、s3、基于离散小波变换结果,计算出模极大值;

59、s4、确定最大尺度e;

60、s5、通过阈值处理获得尺度e上的模极大值;

61、s6、从尺度e-1上去取尺度e上模极大值的传播点;

62、s7、令e=e-1,并重复步骤s4,直至e=2;

63、s8、在e=2时有模极大值的位置处,保留e=1时相对应的模极大值点,并将其余系数置零;

64、s9、利用保留的模极大值构造小波系数,并通过构造的小波系数进行逆离散小波变换获得增强后的话音信号。

65、可选地,进行离散小波变换的公式为:其中,u为离散的尺度指标,v为离散的平移指标,c0为尺度因子,d0为平移步长,尺度参数平移参数

66、小波系数的计算公式为:其中,f(t)为进行小波变换分析的信号;

67、进行逆离散小波变换的公式为:其中,g为常数。

68、一种管制话音数据有效信息增强系统,包括存储器、处理器以及存储在存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的一种管制话音数据有效信息增强方法的步骤。

69、本发明与现有技术相比,具有如下的优点和有益效果:

70、本发明通过将多人交织的管制话音分离为有效的单人话音信号,减少了语音识别时的干扰,并通过对管制话音信号降噪,滤除掉背景噪声以及解交织带来的过程噪声,提高话音信号的清晰度,最后话音信号增强技术则使得有效信号更加鲜明,进一步提升了语音质量。

71、本发明在多人同时说话、存在弱有效信号或者背景噪声干扰的复杂航空管制环境中,保持稳定的高识别率,避免管制员对大量的话音信息进行处理和判断,减少错误并提高系统的整体效率。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22048.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。