技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频源分离的制作方法  >  正文

音频源分离的制作方法

  • 国知局
  • 2024-06-21 11:49:48

本公开总体上涉及音频处理领域,并且具体地涉及音频播放的设备、方法和计算机程序。

背景技术:

1、可用的音频内容许多,例如,以光盘(cd)、磁带、音频数据文件(可以从因特网下载)的形式,但是也可以以例如存储在数字视频盘等上的视频的音轨的形式。

2、当音乐播放器播放现有音乐数据库中的歌曲时,听众可能会想跟着一起唱。通常,最先进的卡拉ok和伴唱系统会持续地使用音频源分离技术来消除播放歌曲时的原始人声。

3、通常需要降低能耗的改进方法和设备。

技术实现思路

1、根据第一方面,本公开提供一种电子设备,包括电路,该电路被配置为:基于使能信号对音频信号执行源分离,以获得包括分离的源和残留信号的经处理的音频信号,其中,使能信号被配置为激活或停用源分离。

2、根据第二方面,本公开提供了一种方法,包括:基于使能信号对音频信号执行源分离,以获得包括分离的源和残留信号的经处理的音频信号,其中,使能信号被配置为激活或停用源分离。

3、根据第三方面,本公开提供了一种计算机程序,包括指令,当该程序由计算机执行时,这些指令使得计算机基于使能信号对音频信号执行源分离,以获得包括分离的源和残留信号的经处理的音频信号,其中,使能信号被配置为激活或停用源分离。

4、在从属权利要求、以下描述和附图中阐述进一步的方面。

技术特征:

1.一种电子设备,包括电路,所述电路被配置为:

2.根据权利要求1所述的电子设备,还包括被如下配置的电路:如果所述源分离被所述使能信号停用,则调整所述音频信号,以获得经调整的音频信号作为所述经处理的音频信号。

3.根据权利要求1所述的电子设备,还包括被如下配置的电路:基于所述使能信号的值来改变开关的位置,以激活或停用所述源分离。

4.根据权利要求1所述的电子设备,其中,所述源分离由深度神经网络实现,并且所述使能信号用于停用所述深度神经网络的一些或所有层,使得所述一些或所有层的输出不再被更新。

5.根据权利要求2所述的电子设备,还包括被如下配置的电路:基于所述使能信号将增益应用于所述音频信号,以获得所述经调整的音频信号。

6.根据权利要求1所述的电子设备,还包括被如下配置的电路:如果所述源分离被所述使能信号停用,则延迟所述音频信号,以获得延迟的音频信号。

7.根据权利要求2所述的电子设备,还包括被如下配置的电路:将增益应用于用户的人声信号,以获得经调整的用户的人声信号,所述用户的人声信号通过麦克风获取。

8.根据权利要求7所述的电子设备,还包括被如下配置的电路:将所述经调整的用户的人声信号与所述经处理的音频信号混合,以获得混合音频信号。

9.根据权利要求1所述的电子设备,还包括被如下配置的电路:基于所述分离的源和所述残留信号执行使能信号生成,以获得所述使能信号。

10.根据权利要求9所述的电子设备,还包括被如下配置的电路:对所述音频信号执行人声检测以获得人声检测信号,其中,基于所述人声检测信号、所述分离的源和所述残留信号来执行所述使能信号生成,以获得所述使能信号。

11.根据权利要求9所述的电子设备,其中,所述使能信号是在服务器侧预先计算的。

12.根据权利要求9所述的电子设备,其中,所述使能信号是在所述电子设备上第一次播放歌曲期间计算的。

13.根据权利要求1所述的电子设备,其中,所述分离的源包括人声,并且所述残留信号包括伴奏。

14.根据权利要求13所述的电子设备,还包括被如下配置的电路:将增益应用于所述人声以获得经调整的人声,并且将增益应用于所述伴奏以获得经调整的伴奏。

15.根据权利要求14所述的电子设备,还包括被如下配置的电路:将所述经调整的人声与所述经调整的伴奏混合,以获得所述经处理的音频信号。

16.根据权利要求1所述的电子设备,其中,所述音频信号包括人声和伴奏中的至少一者,或者其中,所述分离的源包括语音并且所述残留信号包括背景噪声。

17.根据权利要求1所述的电子设备,其中,所述经处理的音频信号被输出到扬声器系统。

18.一种电子设备,包括电路,所述电路被配置为:

19.根据权利要求18所述的电子设备,还包括被如下配置的电路:

20.根据权利要求18所述的电子设备,其中,所述使能信号是在服务器侧使用人声检测网络预先计算的,或者所述使能信号是在所述电子设备上第一次播放歌曲期间使用关于所述分离的源和所述残留信号的能量阈值计算的。

21.一种方法,包括:

22.一种计算机程序,包括指令,当所述程序由计算机执行时,所述指令使得所述计算机执行根据权利要求21所述的方法。

技术总结一种具有电路的电子设备,该电路被配置为基于使能信号对音频信号执行源分离,以获得包括分离的源和残留信号的经处理的音频信号,其中,使能信号被配置为激活或停用源分离。技术研发人员:斯特凡·乌利希,乔治·法布罗,迈克尔·埃嫩克尔,托马斯·肯普,大迫庆一受保护的技术使用者:索尼集团公司技术研发日:技术公布日:2024/5/8

本文地址:https://www.jishuxx.com/zhuanli/20240618/23823.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。