技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种低频歌曲生成方法、设备及介质与流程 > 正文

一种低频歌曲生成方法、设备及介质与流程

国知局
2024-06-21 11:45:53

本发明涉及音频处理，特别涉及一种低频歌曲生成方法、设备及介质。

背景技术：

1、高频听力损失是最常见的听力损失类型之一，高频听损人士则指的是患有高频听力损失症状的人群，他们通常对高频声音分量的敏感程度不够，很难听到音调较高的声音，其对中高频，尤其是4khz以上频段音频的感知能力急剧下降。因此这类人群在收听音乐时，通常只能听到音乐中的低频声音分量，音乐收听效果较差。

2、现有技术以人工手动调节频率来改善上述问题，但这种方式会带来极高的人力成本和时间成本，且效率低下。

3、综上，如何为高频听损人士自动生成相应的低频歌曲，从而使得高频听损人士也可以最大程度感知歌曲的动态与色彩是目前有待解决的问题。

技术实现思路

1、有鉴于此，本发明的目的在于提供一种低频歌曲生成方法、设备及介质，能够为高频听损人士自动生成相应的低频歌曲，从而使得高频听损人士也可以最大程度感知歌曲的动态与色彩。其具体方案如下：

2、第一方面，本技术公开了一种低频歌曲生成方法，包括：

3、按照预设配器轨种类将原始歌曲分离为歌声轨和若干个配器轨，并分别对每一所述配器轨进行能量分析，以根据能量分析结果确定出所述原始歌曲中存在的目标配器轨；

4、确定所述目标配器轨的能量信号在歌曲总时段中出现的目标时段，并在所述目标时段上计算所述目标配器轨在预设低频段的能量集中度；

5、若基于所述能量集中度确定所述目标配器轨的能量信号未集中在所述预设低频段，则对所述目标配器轨进行降调处理，得到处理后配器轨；

6、获取对所述歌声轨进行垫音处理后得到的处理后歌声轨，并对所述处理后歌声轨和所述处理后配器轨进行合成，以生成所述原始歌曲对应的低频歌曲。

7、可选的，所述分别对每一所述配器轨进行能量分析，以根据能量分析结果确定出所述原始歌曲中存在的目标配器轨的过程中，还包括：

8、基于预设帧移和预设帧长将当前待分析配器轨对应的音频划分为若干帧信号，并对各帧信号进行短时傅里叶变换，以得到各帧信号的功率谱；

9、基于所述各帧信号的功率谱计算相应的功率值，并基于所述各帧信号的功率值得到所述当前待分析配器轨的总功率值；

10、基于所述总功率值确定出所述配器轨的总响度值，若所述总响度值大于预设响度阈值，则将所述当前待分析配器轨判定为所述原始歌曲中存在的目标配器轨。

11、可选的，所述确定所述目标配器轨的能量信号在歌曲总时段中出现的目标时段，包括：

12、利用目标平滑核函数对所述目标配器轨的各帧信号的功率谱进行平滑处理，以得到各帧信号对应的平滑后功率值；

13、若所述各帧信号中任一帧信号的平滑后功率值大于所述预设响度阈值，则将所述任一帧信号对应的时间段确定为所述目标配器轨的能量信号在歌曲总时段中出现的目标时段；

14、若所述各帧信号中任一帧信号的所述平滑后功率值不大于所述预设响度阈值，则判定所述任一帧信号对应的时间段不存在所述目标配器轨的能量信号。

15、可选的，所述低频歌曲生成方法，还包括：

16、确定用于对所述功率谱进行平滑处理的时间窗长度，并基于所述时间窗长度和所述预设帧移确定出一次平滑处理的信号帧数；

17、对所述信号帧数执行加一操作，得到更新后信号帧数，并基于所述更新后信号帧数构建初始平滑核函数；

18、对所述初始平滑核函数进行归一化处理，以得到所述目标平滑核函数。

19、可选的，所述在所述目标时段上计算所述目标配器轨在预设低频段的能量集中度，包括：

20、在所述目标时段对应的每一帧信号上，获取预设低频段以内对应频点的第一信号功率和值，以及获取总频点的第二信号功率和值；

21、计算所述第一信号功率和值与所述第二信号功率和值的比值，并利用所述目标平滑核函数对所述比值进行平滑处理，得到平滑后比值；

22、基于所述目标时段上所有帧信号对应的所述平滑后比值得到所述目标配器轨在预设低频段的能量集中度。

23、可选的，所述低频歌曲生成方法，还包括：

24、若所述能量集中度大于预设低频占比阈值，则判定所述目标配器轨的能量信号集中在所述预设低频段；

25、若所述能量集中度不大于所述预设低频占比阈值，则判定所述目标配器轨的能量信号未集中在所述预设低频段。

26、可选的，所述在所述目标时段上计算所述目标配器轨在预设低频段的能量集中度之后，还包括：

27、若基于所述能量集中度确定所述目标配器轨的能量信号集中在所述预设低频段，则对所述目标配器轨的能量信号进行全通滤波处理，得到处理后配器轨。

28、可选的，所述对所述目标配器轨进行降调处理，得到处理后配器轨，包括：

29、利用预设分频器将所述目标配器轨中位于所述预设低频段的音频作为低频音频，并将除所述低频音频以外的其余音频作为高频音频；其中，所述预设分频器基于l-r滤波器构建；

30、基于预设八度降调策略对所述高频音频进行降调处理，得到降调后音频，并对所述低频音频进行全通滤波处理，得到滤波后音频；

31、对所述降调后音频和所述滤波后音频进行混合处理，得到处理后配器轨。

32、可选的，所述获取对所述歌声轨进行垫音处理后得到的处理后歌声轨，包括：

33、利用基频提取工具和crepe模型检测所述歌声轨的基频信息，并计算所述基频信息在预设频段内的基频集中度；

34、若所述基频集中度大于预设阈值，则对所述歌声轨进行全通滤波处理，得到处理后歌声轨；

35、若所述基频集中度不大于所述预设阈值，则基于八度降调策略对所述歌声轨进行降调处理得到降调后人声，并利用所述降调后人声和第一预设权重参数对所述歌声轨进行垫音处理，得到处理后歌声轨。

36、可选的，所述获取对所述歌声轨进行垫音处理后得到的处理后歌声轨，包括：

37、利用基频提取工具和crepe模型检测所述歌声轨的基频信息，并确定出所述基频信息中未位于预设频段内的目标基频；

38、基于预设八度降调策略对所述目标基频进行降调处理得到降调后基频，并利用所述降调后音频和第二预设权重参数在所述目标基频所在的时段上进行垫音处理得到处理后歌声轨。

39、可选的，所述对所述处理后歌声轨和所述处理后配器轨进行合成，以生成所述原始歌曲对应的低频歌曲之后，还包括：

40、确定目标用户的听力受损程度，并基于广义动态范围压缩技术确定出与所述听力受损程度对应的响度调整参数；

41、利用所述响度调整参数所述低频歌曲的响度进行调整，并对调整后低频歌曲进行播放。

42、第二方面，本技术公开了一种电子设备，包括：

43、存储器，用于保存计算机程序；

44、处理器，用于执行所述计算机程序，以实现前述公开的低频歌曲生成方法的步骤。

45、第三方面，本技术公开了一种计算机可读存储介质，用于存储计算机程序；其中，所述计算机程序被处理器执行时实现前述公开的低频歌曲生成方法的步骤。

46、可见，本技术通过按照预设配器轨种类将原始歌曲分离为歌声轨和若干个配器轨，并分别对每一所述配器轨进行能量分析，以根据能量分析结果确定出所述原始歌曲中存在的目标配器轨；确定所述目标配器轨的能量信号在歌曲总时段中出现的目标时段，并在所述目标时段上计算所述目标配器轨在预设低频段的能量集中度；若基于所述能量集中度确定所述目标配器轨的能量信号未集中在所述预设低频段，则对所述目标配器轨进行降调处理，得到处理后配器轨；获取对所述歌声轨进行垫音处理后得到的处理后歌声轨，并对所述处理后歌声轨和所述处理后配器轨进行合成，以生成所述原始歌曲对应的低频歌曲。

47、由此可见，本技术首先按照预设配器轨种类将原始歌曲分离为歌声轨和若干个配器轨，并分别对每一配器轨进行能量分析，以根据能量分析结果确定出原始歌曲中存在的目标配器轨，也即本实施例首先确定出原始歌曲中存在哪些配器轨。进一步的，本技术再确定出目标配器轨的能量信号出现在歌曲总时段中的哪些时段，从而得到目标时段，并通过在目标时段上计算目标配器轨在预设低频段的能量集中度以确定出目标配器轨的能量信号是否集中在预设低频段。若目标配器轨的能量信号未集中在预设低频段，则说明目标配器轨上存在高频听损人士难以感知的高频分量，因此需要对目标配器轨进行降调处理，得到处理后配器轨。并且本技术还需对分离出的歌声轨进行垫音处理得到处理后歌声轨，从而对处理后歌声轨和处理后配器轨进行合成，以生成与原始歌曲对应的低频歌曲。如此一来，本技术通过先后对分离出的各配器轨进行能量分析和降调处理，再和垫音处理后的歌声轨进行合成的方式，能够自动生成针对高频听损人士的低频歌曲，从而使得高频听损人士也可以最大程度感知歌曲的动态与色彩，并且本技术无需人工参与，节省了大量人力成本和时间成本。