技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种摩斯信号活动区域检测与截取方法  >  正文

一种摩斯信号活动区域检测与截取方法

  • 国知局
  • 2024-06-21 11:40:18

本发明涉及一种摩斯信号活动区域检测与截取方法,属于通信。

背景技术:

1、在音频数据流中检测出摩斯信号段是进行准确摩斯译码的前提,摩斯信号可以看作一种特殊的语音信号,目前与摩斯信号段检测最接近的现有技术是语音活动检测(vad)技术。vad是一项关键的语音处理技术,它旨在从音频信号中准确区分语音和非语音部分。研究人员采用了多种方法来实现vad,包括基于能量和过零率的传统技术、基于统计模型的建模方法、深度学习技术的应用以及时频特征分析等。近年来,随着深度学习和多模态融合技术的发展,vad在噪声环境下的鲁棒性和准确性得到了显著提高。这些方法的不断创新使得vad在语音识别、语音通信和语音处理等领域中发挥着关键作用,为人机交互提供更智能、高效的语音体验。相较于摩斯信号,语音信号的频谱较宽,像摩斯信号一样通过带通滤波滤除大部分噪声是很难的,当信噪比较低时,基于能量的方法来进行vad检测效果急剧下降。摩斯信号具有单一、固定的载波频率,其本质上是依据信号在载频处的能量有无以及高能量段的持续时间来传递信息的,因此,基于载频处的信号能量来进行摩斯信号检测流检测是可靠的。

技术实现思路

1、发明目的,本发明旨在实现对含有摩斯信号的音频数据进行摩斯信号活动区域检测与截取。

2、技术方案,为了实现上述发明目的,本发明提出一种摩斯信号活动区域检测与截取方法,该方法包括以下步骤:

3、s1、读取含有摩斯信号的音频,对该音频数据audio_data进行短时傅里叶变换,选定计算stft时的窗口为汉明窗,取窗口长度为window_len,窗口重叠长度为overlap_len,经过短时傅里叶变换得到时频矩阵,取出时频矩阵中对应载波频率的那一行数据,并对该行数据中每个元素依次进行取模操作、平方操作,得到一个元素恒正的序列,记为能量特征序列;

4、s2、选定一个长度为maxwin_len的窗口,使用该窗口在能量特征序列上从左到右滑动,每次移动一个数据点,在每个窗口的位置,计算窗口内的最大值,并将这些最大值存储在一个新的序列中,记这个新的序列为最大值序列;

5、s3、从左到右搜索最大值序列的上升沿,当判断存在上升沿时停止搜索,记找到的上升沿出现在最大值序列的索引index1处;

6、s4、依据索引index1计算摩斯信号截取起点start,start为音频数据audio_data中的一个索引值;

7、s5、取最大值序列中,索引index1左边最近的m个数据估计噪声,噪声估计值e_noise等于这m个数据的平均值;

8、s6、在最大值序列中,使用一个长度为stationary_len的窗口从索引index1开始向右滑动,每次移动一个数据点,在窗口的每个位置计算窗口内最大值与最小值之差,若差值小于预设的阈值stationary_threshold,则窗口停止滑动,记窗口最右端位置所对应的最大值序列索引为index2,计算窗口内所有数据点的最小值,记该最小值为摩斯信号能量估计值e_morse;

9、s7、根据噪声估计值e_noise和摩斯信号能量估计值e_morse计算摩斯信号结束阈值stop_threshold;

10、s8、对于最大值序列,从索引index2位置处向右遍历最大值序列中的每个元素,若某个元素值小于结束阈值stop_threshold,则记该元素所对应的索引为index3;

11、s9、依据索引index3计算摩斯信号截取终点end,end为音频数据audio_data中的一个索引值;

12、s10、截取出音频数据audio_data中对应于索引start和end之间的元素,即为摩斯信号活动区域截取部分;

13、s11、返回s3,从最大值序列的索引index3开始,向右寻找上升沿,重复上述步骤。

14、进一步的,所述s1中,能量特征序列的获取步骤包括:

15、对音频数据进行短时傅里叶变换获取时频矩阵sf×t,f是频率维度大小,t是时间维度大小,时频矩阵第k行第l列x(k,l)的计算过程表示为:

16、

17、其中,x(n)为音频数据,w(n)为所加的窗函数,使用汉明窗,n为窗函数的长度,k为离散傅里叶变换的点数,l为窗口每次步进的长度,记音频信号采样频率为fs,摩斯信号载波频率为fc,则时频矩阵中对应载波频率的行坐标kc表示如下:

18、

19、能量特征序列即为|x(kc,l)|2。

20、进一步的,所述s3中,上升沿的判断方法包括:

21、选定一个长度为chop_len滑动窗口,在最大值序列上从左向右开始滑动,每次移动一个数据点,在窗口的每个位置都会计算窗口内最大值与最小值之差,若差值小于预设的阈值chop_threshold,且窗口内的最大值出现在最小值的右边,则窗口停止滑动,记此时窗口所在位置的起点索引为index1。

22、进一步的,所述s4中,截取起点start的计算方法如下:

23、start=(index1+maxwin_len/2)×(window_len-overlap_len)。

24、进一步的,所述s7中,涉及的摩斯信号结束阈值stop_threshold的计算方法如下:

25、stop_threshold=e_noise+(e_morse-e_noise)×β

26、其中,β是一个预设的系数,取值在0到1之间。

27、进一步的,所述s9中,截取终点索引end的计算方法如下:

28、end=(index3+maxwin_len/2)×(window_len-overlap_len)。

29、有益效果,与现有技术相比,本发明的技术方案具有以下有益技术效果:

30、本发明基于音频信号在载频处的能量来判断摩斯信号的有无,间接滤除了频带外的噪声;本发明对每一帧的短时能量在一定区域内取最大值,很好的提取出了音频数据在载频处能量的轮廓,同时也能够很好的保留信号在能量突变处的陡峭性;本发明通过实时寻找上升沿的方式来判断摩斯信号的起点,能够提高检测摩斯信号活动区域起点的精确度;本发明在判断摩斯信号结束点时,基于噪声估计值与摩斯信号估计值来计算出一个自适应的摩斯信号结束阈值,使得该方法能够适合于不同噪声能量水平的情况。本发明在衰落信道下也能达到很好的截取精确度。

技术特征:

1.一种摩斯信号活动区域检测与截取方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种摩斯信号活动区域检测与截取方法,其特征在于,s1中,能量特征序列的获取步骤如下:

3.根据权利要求2所述的一种摩斯信号活动区域检测与截取方法,其特征在于,所述s3中,上升沿的判断方法包括:

4.根据权利要求1所述的一种摩斯信号活动区域检测与截取方法,其特征在于,所述s4中,截取起点start的计算方法如下:

5.根据权利要求1所述的一种摩斯信号活动区域检测与截取方法,其特征在于,所述s7中,摩斯信号结束阈值stop_threshold的计算方法如下:

6.根据权利要求1所述的一种摩斯信号活动区域检测与截取方法,其特征在于,所述s9中,截取终点索引end的计算方法如下:

技术总结本发明公开了一种摩斯信号活动区域检测与截取方法,用以在音频信号中完整的截取出存在摩斯信号的部分。所述方法包括信号能量提取,获取由信号能量构成的一维序列;局部最大值处理,获取能量序列包络的同时保留上升沿的突变特性;上升沿搜索,寻找信号的上升沿所在的位置,基于此判定摩斯信号的起点;信号能量估计,估计摩斯信号的能量;噪声估计,估计噪声能量;获取摩斯信号结束阈值,结束阈值依据摩斯信号能量估计值和噪声能量估计值来确定;摩斯信号结束点搜索,基于结束阈值来寻找摩斯信号的结束位置。本发明能够高效、准确的实现摩斯信号活动区域的检测与截取,有较广泛的实用价值。技术研发人员:王俊波,高长江,彭志新,吴立强,毛钦曙,郝岩明,高庆鑫受保护的技术使用者:东南大学技术研发日:技术公布日:2024/3/31

本文地址:https://www.jishuxx.com/zhuanli/20240618/22808.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。