一种音乐流派的识别方法、装置、电子设备及存储介质
- 国知局
- 2024-06-21 11:26:45
本发明涉及数据处理,尤其涉及一种音乐流派的识别方法、装置、电子设备及存储介质。
背景技术:
1、近些年来,音乐流派的分类是一个比较重要的课题,越来越多的人投入到相关的研究领域。音乐流派分类可以在许多现实应用中使用,媒体平台可以根据音乐流派为用户创建更合适的推荐播放列表。
2、当前,音乐流派分类方法主要依赖人工提取的音乐声学特征和面向深度学习的音频特征,以及采用的训练特征向量的深度学习网络模型。相关领域提出常见的人工提取的特征主要有梅尔频域倒谱系数(mel-scale frequency cepstral coefficients,mfcc),频谱特征,音高和节奏特征等。例如,梅尔倒谱系数提取的特征更能近似人类的听觉系统,大部分的音乐流派分类方法将其传入卷积神经网络并提取音乐的频率特征向量。由于mfcc作为输入传递给神经网络过程中需要将连续的mfcc序列转换成图像或者张量形式,这个转换过程中主要放大了低频部分的音乐信息,缩减了中高频时序信息,可能会降低分类结果的准确性。其次,对于卷积神经网络常用的频谱图特征包括短时傅里叶频谱图、梅尔频谱图和常数q频谱图,但目前无法应用三种频谱图融合特征进行分类。故,如何便捷且准确的识别音乐流派成为目前亟待解决的问题。
技术实现思路
1、本发明提供了一种音乐流派的识别方法、装置、电子设备及存储介质,以同时提取频域的多种特征,从多个维度考虑音乐流派的分类,以解决现有技术中音乐流派分类准确度不高的问题。
2、根据本发明的一方面,提供了一种音乐流派的识别方法,其中,该方法包括:
3、确定待识别音频的时域数据和频域数据,分别提取所述时域数据包含的时域特征以及所述频域数据包含的频域特征;
4、将各所述时域特征对应的所述频域特征与各所述时域特征拼接生成第一数据;
5、根据第一流派识别模型生成所述第一数据归属不同音乐流派的第一概率,并根据各所述第一概率确定所述待识别音频的音乐流派。
6、根据本发明的另一方面,提供了一种音乐流派的识别装置,其中,该装置包括:
7、数据确定模块,用于确定待识别音频的时域数据和频域数据,分别提取所述时域数据包含的时域特征以及所述频域数据包含的频域特征;
8、数据拼接模块,用于将各所述时域特征对应的所述频域特征与各所述时域特征拼接生成第一数据;
9、流派确定模块,用于根据第一流派识别模型生成所述第一数据归属不同音乐流派的第一概率,并根据各所述第一概率确定所述待识别音频的音乐流派。
10、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
11、至少一个处理器;以及
12、与所述至少一个处理器通信连接的存储器;其中,
13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的音乐流派的识别方法。
14、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的音乐流派的识别方法。
15、本发明实施例的技术方案,通过确定待识别音频的时域数据和频域数据,分别提取时域数据包含的时域特征以及频域数据包含的频域特征,将各时域特征对应的频域特征与各时域特征拼接生成第一数据,根据第一流派识别模型生成第一数据归属不同音乐流派的第一概率,并根据各第一概率确定待识别音频的音乐流派,实现基于时域特征以及频域数据共同确定不同音乐流派的概率,从多个维度进行音乐流派的识别,提高音乐流派分类的准确性,提升用户的使用体验。
16、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
技术特征:1.一种音乐流派的识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
3.根据权利要求1所述的方法,其特征在于,所述确定待识别音频的时域数据和频域数据,分别提取所述时域数据包含的时域特征以及所述频域数据包含的频域特征,包括:
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一概率、所述第二概率、所述第三概率以及第四概率确定所述待识别音频数据的音乐流派,包括:
5.根据权利要求4所述的方法,其特征在于,所述按照所述第三概率和所述第四概率确定时域特征与频域特征结合归属于不同音乐流派的第五概率,包括:
6.根据权利要求1所述的方法,其特征在于,在所述确定待识别音频的时域数据和频域数据,分别提取所述时域数据包含的时域特征以及所述频域数据包含的频域特征之后,还包括:
7.根据权利要求1所述的方法,其特征在于,在所述确定待识别音频的时域数据和频域数据,分别提取所述时域数据包含的时域特征以及所述频域数据包含的频域特征之前,包括:
8.一种音乐流派的识别装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的音乐流派的识别方法。
技术总结本发明公开了一种音乐流派的识别方法、装置、电子设备及存储介质,涉及数据处理技术领域。该音乐流派的识别方法,包括:确定待识别音频的时域数据和频域数据,分别提取所述时域数据包含的时域特征以及所述频域数据包含的频域特征;将各所述时域特征对应的所述频域特征与各所述时域特征拼接生成第一数据;根据第一流派识别模型生成所述第一数据归属不同音乐流派的第一概率,并根据各所述第一概率确定所述待识别音频的音乐流派。本发明实施例,实现基于时域特征以及频域数据共同确定不同音乐流派的概率,从多个维度进行音乐流派的识别,提高音乐流派分类的准确性,提升用户的使用体验。技术研发人员:陈敏,苏航,姜彦吉,刘昌镐,郑四发受保护的技术使用者:清华大学苏州汽车研究院(相城)技术研发日:技术公布日:2024/2/8本文地址:https://www.jishuxx.com/zhuanli/20240618/21569.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。