技术新讯 > 乐器声学设备的制造及制作,分析技术 > 特征提取方法、装置、电子设备和存储介质与流程  >  正文

特征提取方法、装置、电子设备和存储介质与流程

  • 国知局
  • 2024-06-21 11:40:19

本发明涉及数据处理,尤其涉及一种特征提取方法、装置、电子设备和存储介质。

背景技术:

1、随着互联网的发展,音频数据的产生和使用呈现出爆炸式增长的趋势。这些音频数据包括语音、音乐、广播等各种声音信息,对于这些音频数据的快速分类、识别、转写等操作需求也日益增加。

2、音频特征提取是将音频信号转换为计算机可以理解的数字形式的过程,通常用于语音识别、音乐分类、声音检索等领域。传统的音频特征提取方法主要基于频谱分析和时域分析等技术,其中频谱分析是将音频信号转换为频域信号,然后对频域信号进行分析得到特征;时域分析则是在时间域上对音频信号进行分析得到特征。

3、然而,这些方法在处理复杂音频信号时都存在一定的局限性,频谱分析方法虽然可以提取音频信号的频域信息,但对于时变、非线性的音频信号效果较差,且需要大量的计算资源;而时域分析方法难以处理非语音信号,且对于复杂音频信号的效果也较差。因此,亟需一种更加高效、准确的特征提取方法。

技术实现思路

1、本发明提供一种特征提取方法、装置、电子设备和存储介质,用以解决现有技术中音频特征提取效果差、效率低的缺陷。

2、本发明提供一种特征提取方法,包括:

3、获取多帧流式数据的初始特征;

4、逐帧对所述多帧流式数据的初始特征进行前向特征提取,得到多帧前向特征;

5、对所述多帧流式数据的初始特征进行切分,得到多个分段帧,并对所述多个分段帧进行反向特征提取,得到多帧反向特征;

6、将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征。

7、根据本发明提供的一种特征提取方法,所述对所述多帧流式数据的初始特征进行切分,得到多个分段帧,包括:

8、基于所述多帧流式数据的初始特征,每隔预设帧数进行特征截取,得到反向输入特征,所述预设帧数为预设窗口长度的整数倍帧数;

9、对所述反向输入特征进行切分,得到多个分段帧。

10、根据本发明提供的一种特征提取方法,所述基于所述多帧流式数据的初始特征,每隔预设帧数进行特征截取,得到反向输入特征,包括:

11、存储所述多帧流式数据的初始特征,得到已存储初始特征;

12、在流式数据在线传输未完成的情况下,从所述已存储初始特征中截取所述预设帧数的特征,得到所述反向输入特征,直至流式数据在线传输完成,将剩余的所述已存储初始特征作为所述反向输入特征。

13、根据本发明提供的一种特征提取方法,所述对所述反向输入特征进行切分,得到多个分段帧,包括:

14、基于所述预设窗口长度和预设重叠长度,对所述反向输入特征进行滑动窗口切分,得到多个分段帧;

15、若任一分段帧的长度不为所述预设窗口长度,则对所述任一分段帧进行补位,直至所述任一分段帧的长度达到所述预设窗口长度。

16、根据本发明提供的一种特征提取方法,所述对所述多个分段帧进行反向特征提取,得到多帧反向特征,包括:

17、对所述多个分段帧进行运算,得到多个运算结果;

18、基于预设窗口长度和预设重叠长度,确定有效帧长度,并从各运算结果中取所述有效帧长度的特征,得到各有效特征;

19、将所述各有效特征中的补位特征删除并拼接,得到所述多帧反向特征。

20、根据本发明提供的一种特征提取方法,所述将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征,包括:

21、存储所述多帧前向特征和所述多帧反向特征,得到已存储前向特征和已存储反向特征;

22、基于所述已存储前向特征的帧数和所述已存储反向特征的帧数,确定拼接帧数;

23、在所述拼接帧数不为零的情况下,从所述已存储前向特征中取所述拼接帧数的第一特征,并从所述已存储反向特征中取所述拼接帧数的第二特征,将所述第一特征和所述第二特征进行拼接,得到所述拼接后特征;

24、基于所述拼接后特征,确定所述多帧流式数据的目标特征。

25、根据本发明提供的一种特征提取方法,所述流式数据包括音频数据、文本数据、传感器数据、网络数据中的任意一种。

26、本发明还提供一种特征提取装置,包括:

27、获取单元,用于获取多帧流式数据的初始特征;

28、前向单元,用于逐帧对所述多帧流式数据的初始特征进行前向特征提取,得到多帧前向特征;

29、反向单元,用于对所述多帧流式数据的初始特征进行切分,得到多个分段帧,并对所述多个分段帧进行反向特征提取,得到多帧反向特征;

30、拼接单元,用于将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征。

31、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述特征提取方法。

32、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述特征提取方法。

33、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述特征提取方法。

34、本发明提供的特征提取方法、装置、电子设备和存储介质,通过对多帧流式数据的初始特征进行前向特征提取和反向特征提取,可以充分利用流式数据的前后帧信息,更全面地描述多帧流式数据的特征,从而更准确地进行特征提取,通过拼接前向特征和反向特征,并基于拼接后特征确定最终的目标特征,可以获得更丰富的特征表示,提高特征的表达能力。此外,通过将多帧流式数据的初始特征进行切分,并对多个分段帧进行反向特征提取,不仅可以减少计算时间,提高计算效率,还可以提高特征的鲁棒性和稳定性。

技术特征:

1.一种特征提取方法,其特征在于,包括:

2.根据权利要求1所述的特征提取方法,其特征在于,所述对所述多帧流式数据的初始特征进行切分,得到多个分段帧,包括:

3.根据权利要求2所述的特征提取方法,其特征在于,所述基于所述多帧流式数据的初始特征,每隔预设帧数进行特征截取,得到反向输入特征,包括:

4.根据权利要求2所述的特征提取方法,其特征在于,所述对所述反向输入特征进行切分,得到多个分段帧,包括:

5.根据权利要求1所述的特征提取方法,其特征在于,所述对所述多个分段帧进行反向特征提取,得到多帧反向特征,包括:

6.根据权利要求1至5任一项所述的特征提取方法,其特征在于,所述将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征,包括:

7.根据权利要求1至5任一项所述的特征提取方法,其特征在于,所述流式数据包括音频数据、文本数据、传感器数据、网络数据中的任意一种。

8.一种特征提取装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述特征提取方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述特征提取方法。

技术总结本发明提供一种特征提取方法、装置、电子设备和存储介质,其中方法包括:获取多帧流式数据的初始特征;逐帧对所述多帧流式数据的初始特征进行前向特征提取,得到多帧前向特征;对所述多帧流式数据的初始特征进行切分,得到多个分段帧,并对所述多个分段帧进行反向特征提取,得到多帧反向特征;将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征。本发明提供的方法、装置、电子设备和存储介质,可以更加准确、高效地进行特征提取,提高特征的表达能力和鲁棒性。技术研发人员:苏涛,杨康,李宝善,王超,王慧娟,张凯波,吴奎受保护的技术使用者:科大讯飞股份有限公司技术研发日:技术公布日:2024/3/31

本文地址:https://www.jishuxx.com/zhuanli/20240618/22812.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。