技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音乐处理方法及装置与流程 > 正文

音乐处理方法及装置与流程

国知局
2024-06-21 11:31:33

本申请涉及计算机，特别涉及一种音乐处理方法、装置、计算机设备及存储介质。

背景技术：

1、在流行歌曲中，副歌往往会多次重复出现，通常有丰富的乐器和复杂的节奏形式。副歌片段一般是音乐中最具感染力和吸引力的精彩片段，在短视频背景音乐制作中，为了在有限的时间内吸引用户，副歌片段通常被选用来做视频的背景音乐，以快速吸引用户的关注。

2、副歌检测是音乐信号处理中一个具有挑战性的问题，目前，选取副歌的方法一般分为以下两种：

3、(1)人工根据视觉和听觉的判断选取副歌部分，这种方法虽然识别的准确率较高，但是需要耗费大量的人力，效率较低；

4、(2)采用计算机设备来选取副歌，这些方法大多数是基于音乐中声音的响度、声音出现的频率、节奏密度等显性特征作预先假设来判断，虽然这些方法相比人工的方法而言效率较高，但是这种预先假设限制了方法的泛化能力，使得副歌识别的准确率不高。

技术实现思路

1、本申请的目的在于提供一种音乐处理方法、装置、计算机设备及存储介质，用于解决目前副歌识别的效率及准确率较低的技术问题。

2、本申请实施例的一个方面提供了一种音乐处理方法，包括：将目标音乐进行声源分离，以得到至少两个媒体资源，至少一个所述媒体资源对应一种音乐成分；提取每一所述媒体资源的第一特征；根据所述第一特征确定所述目标音乐的副歌片段。

3、可选地，所述将目标音乐进行声源分离，以得到至少两个媒体资源，包括：将目标音乐进行声源分离，以得到对应所述目标音乐整体的媒体资源和分别对应人声成分、鼓声成分和贝斯成分的媒体资源。

4、可选地，所述提取每一所述媒体资源的第一特征，根据所述第一特征确定所述目标音乐的副歌片段，包括：提取每一所述媒体资源的频域特征；根据所述频域特征确定每一所述媒体资源的自相似矩阵；将所述自相似矩阵输入至识别模型中，以通过所述识别模型确定所述目标音乐中每一帧为副歌的概率；根据所述概率确定所述目标音乐的副歌片段。

5、可选地，所述提取每一所述媒体资源的频域特征，包括：提取每一所述媒体资源在mel谱或cqt谱中的频域特征。

6、可选地，所述识别模型由卷积神经网络训练得到。

7、可选地，所述识别模型由卷积神经网络和self attention训练得到。

8、可选地，所述根据所述概率确定所述目标音乐的副歌片段，包括：确定所述目标音乐中每一帧的概率是否超过预设阈值；在所述目标音乐中当前帧的概率大于或等于所述预设阈值的情况下，确定所述当前帧属于副歌部分；根据所述目标音乐中部分帧或所有帧是否属于副歌部分的结果、确定所述目标音乐的副歌片段。

9、本申请实施例的一个方面又提供了一种音乐处理装置，包括：分离模块，用于将目标音乐进行声源分离，以得到至少两个媒体资源，至少一个所述媒体资源对应一种音乐成分；提取模块，用于提取每一所述媒体资源的第一特征；确定模块，用于根据所述第一特征确定所述目标音乐的副歌片段。

10、本申请实施例的一个方面又提供了一种计算机设备，所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时用于实现上述的音乐处理方法的步骤。

11、本申请实施例的一个方面又提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行上述的音乐处理方法的步骤。

12、本申请实施例提供的音乐处理方法、装置、计算机设备及存储介质，包括以下优点：

13、通过将目标音乐进行声源分离，以得到至少两个媒体资源，至少一个媒体资源对应一种音乐成分，提取每一媒体资源的第一特征，根据第一特征确定目标音乐的副歌片段，由于可以使用计算机设备自动识别目标音乐的副歌片段，因此相比人工的方式具有更高的效率；而由于是根据至少一种音乐成分的媒体资源的特征对目标音乐的副歌进行识别，因此可以根据不同的音乐进行不同的判断，相比预先假设来判断的方法具有更高的泛化能力，从而具有更高的准确率。

技术特征：

1.一种音乐处理方法，其特征在于，包括：

2.根据权利要求1所述的音乐处理方法，其特征在于，所述将目标音乐进行声源分离，以得到至少两个媒体资源，包括：

3.根据权利要求1所述的音乐处理方法，其特征在于，所述提取每一所述媒体资源的第一特征，根据所述第一特征确定所述目标音乐的副歌片段，包括：

4.根据权利要求3所述的音乐处理方法，其特征在于，所述提取每一所述媒体资源的频域特征，包括：

5.根据权利要求3所述的音乐处理方法，其特征在于，所述识别模型由卷积神经网络训练得到。

6.根据权利要求3所述的音乐处理方法，其特征在于，所述识别模型由卷积神经网络和self attention训练得到。

7.根据权利要求4-6任一项所述的音乐处理方法，其特征在于，所述根据所述概率确定所述目标音乐的副歌片段，包括：

8.一种音乐处理装置，其特征在于，包括：

9.一种计算机设备，所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时用于实现权利要求1至7中任一项所述的音乐处理方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行权利要求1至7中任一项所述的音乐处理方法的步骤。

技术总结本申请实施例提供一种音乐处理方法，所述方法包括：将目标音乐进行声源分离，以得到至少两个媒体资源，至少一个所述媒体资源对应一种音乐成分；提取每一所述媒体资源的第一特征；根据所述第一特征确定所述目标音乐的副歌片段。本申请实施例提供的音乐处理方法，可以在提高副歌识别的效率的同时提高副歌识别的准确率。技术研发人员：请求不公布姓名,舒景辰受保护的技术使用者：上海哔哩哔哩科技有限公司技术研发日：技术公布日：2024/3/4