技术新讯 > 乐器声学设备的制造及制作,分析技术 > 由电子设备执行的方法和装置与流程  >  正文

由电子设备执行的方法和装置与流程

  • 国知局
  • 2024-06-21 11:54:32

本公开涉及语音处理技术和人工智能,更具体地,涉及一种由电子设备执行的方法和装置。

背景技术:

1、目前,在语音分离领域中,基于深度学习的语音分离算法已经超越了传统信号处理的算法,其高度的非线性建模能力会在任务中取得较好的效果。在深度学习的方法中,由于递归神经网络有着天然的时序依赖的特性,特别适合用来描述自然语言和时间序列中有序列关系的输入数据,它是现代智能语音处理系统中的一个重要组成部分,它们的循环连接对于学习语音的长序列关系和正确管理语音上下文至关重要。但是,由于递归神经网络下一步的计算依赖于上一步输出的隐层状态,当在某段时间内不存在将要分离的声源信号时,现有的语音分离方案并不能精准地分离出各声源的语音信号,分离精确度需要进一步优化。

技术实现思路

1、本公开的示例性实施例提供了一种由电子设备执行的方法和装置,至少解决上述技术问题和上文未提及的其它技术问题,并且提供下述的有益效果。

2、根据本公开实施例的第一方面,提供一种由电子设备执行的方法,所述方法可包括:获取待处理的音频信号,其中,所述音频信号包括至少一个声源发出的语音信号;确定所述音频信号的目标音频片段,其中,所述目标音频片段基于从所述音频信号划分出的各个音频片段的语音质量确定;基于所述目标音频片段对所述音频信号进行语音分离,得到与每个声源对应的分离语音信号。

3、根据本公开实施例的第二方面,提供一种由电子设备执行的方法,所述方法可包括:获取训练样本,其中,所述训练样本包括由至少一个声源在无噪声环境下发出的语音信号以及由所述语音信号和噪声信号组成的音频信号;由语音处理模型包括的音频片段搜索模块确定所述音频信号的目标音频片段,其中,所述目标音频片段基于从所述音频信号划分出的各个音频片段的语音质量确定;由语音处理模型包括的分离模块基于所述目标音频片段对所述音频信号进行语音分离,得到与每个声源对应的分离语音信号;基于获取的语音信号和对应的所述分离语音信号,对所述语音处理模型的参数进行调整。

4、根据本公开实施例的第三方面,提供一种电子设备,所述电子设备可包括:至少一个处理器;至少一个存储计算机可执行指令的存储器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如上所述的方法。

5、根据本公开实施例的第四方面,提供一种存储指令的计算机可读存储介质,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如上所述的方法。

6、根据本公开实施例的第五方面,提供一种计算机程序产品,所述计算机程序产品中的指令被电子装置中的至少一个处理器运行以执行如上所述的方法。

7、本公开通过使用自适应连接目标音频片段的建模方法,从音频信号中分离出每个声源信号,不仅能够解决预测网络的长时遗忘问题,而且能够显著提高语音分离的准确度。

技术特征:

1.一种由电子设备执行的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述语音质量包括以下项中的至少一个:语音失真度、信噪比、过零率和基音数量。

3.根据权利要求1或2所述的方法,其特征在于,确定所述音频信号的目标音频片段,包括:

4.根据权利要求3所述的方法,其特征在于,逐个音频块地确定对应的目标音频片段,包括:

5.根据权利要求3所述的方法,其特征在于,逐个音频块地确定对应的目标音频片段,包括:

6.根据权利要求4或5所述的方法,其特征在于,基于比较结果确定针对所述当前音频块的与所述每个声源对应的目标音频片段,包括:

7.根据权利要求2所述的方法,其特征在于,所述语音失真度通过计算针对音频片段的分离语音信号与参考音频信号之间的相关性确定,其中所述参考音频信号为所述音频片段对应的原始音频信号减去所述分离语音信号得到的音频信号。

8.根据权利要求2所述的方法,其特征在于,所述信噪比通过计算针对音频片段的分离语音信号与所述音频片段对应的原始音频信号之间的比值确定。

9.根据权利要求3所述的方法,其特征在于,基于针对当前音频片段所在的音频块的前一音频块确定的目标音频片段和所述当前音频片段的前一音频片段,对所述当前音频片段进行语音分离,得到与每个声源对应的分离语音信号,包括:

10.根据权利要求9所述的方法,其特征在于,其中,所述隐层状态信息是在对所述目标音频片段和所述前一音频片段分别进行语音分离时获得;和/或

11.根据权利要求9或10所述的方法,其特征在于,所述当前音频片段包括多个音频单元,其中,基于所述融合隐层状态信息对所述当前音频片段进行语音分离,包括:

12.一种电子设备,其特征在于,包括:

13.一种存储指令的计算机可读存储介质,其特征在于,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1到11中的任一项权利要求所述的方法。

技术总结本公开提供一种由电子设备执行的方法和装置。一种由电子设备执行的方法可包括:获取待处理的音频信号,其中,所述音频信号包括至少一个声源发出的语音信号;确定所述音频信号的目标音频片段,其中,所述目标音频片段基于从所述音频信号划分出的各个音频片段的语音质量确定;基于所述目标音频片段对所述音频信号进行语音分离,得到与每个声源对应的分离语音信号。技术研发人员:刘炜,杨磊,谭璐芬受保护的技术使用者:北京三星通信技术研究有限公司技术研发日:技术公布日:2024/5/29

本文地址:https://www.jishuxx.com/zhuanli/20240618/24409.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。