技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于特征选择的多情感音乐数据分类方法、装置及可读介质  >  正文

基于特征选择的多情感音乐数据分类方法、装置及可读介质

  • 国知局
  • 2024-11-21 12:12:04

本发明涉及音乐数据分类领域,具体涉及一种基于特征选择的多情感音乐数据分类方法、装置及可读介质。

背景技术:

1、在线音乐的快速发展,为用户对音乐的获取提供了极大的便利。为了方便用户选择,在线音乐通常会对音乐进行分类,基于情感的音乐分类是常见的一种分类方式。由于同一首音乐可能产生不同的情感,此时单个分类结果的情感难以概括,需要多个情感分类结果来更准确、更全面地概括一首音乐的情感类别。同时,音乐情感认知带有主观性,因此需要为每个用户提供个性化的音乐情感分类。随着多媒体技术的进步,在多情感音乐数据中集成了成千上万的特征。高维的特征导致维度灾难,其包含许多不相关和冗余的特征,这些特征可能不利于给多情感音乐数据关联合适的分类结果。特征选择是一种有效的方法,在不改变原有数据特征的情况下,识别出最具信息的特征来提高分类性能。

2、现有的特征选择方法可以归纳为三种模式,分别是基于过滤式的方法、基于包装式的方法和基于嵌入式的方法。在上述方法中,基于嵌入式的方法是近年来最流行的方法。这类方法将特征选择与学习模型相结合,在模型优化过程中自动进行生成特征重要性排序。在基于过滤式的方法中,利用统计学的一般特性去评估特征。这类方法的特征选择不依靠任何学习模型,难以获得理想的特征子集。在基于包装式的方法中,利用群智能优化算法去搜索最优特征子集,这类方法的迭代次数一般在几十万次,要求昂贵的时间开销。

技术实现思路

1、本技术的目的在于针对上述提到的技术问题提出一种基于特征选择的多情感音乐数据分类方法、装置及可读介质。

2、第一方面,本发明提供了一种基于特征选择的多情感音乐数据分类方法,包括以下步骤:

3、获取若干个具有已知情感标签的多情感音乐数据,基于若干个具有已知情感标签的多情感音乐数据构造出特征空间矩阵和标记空间矩阵;

4、从特征空间矩阵随机生成特征选择矩阵,基于特征空间矩阵和特征选择矩阵构造出具有结构化子空间的流形学习框架,通过潜在子空间探索音乐数据的相关性并构造出多情感音乐数据的几何结构,基于标记空间矩阵构造标记相关性模型,根据流形学习框架、几何结构和标记相关性模型构造出目标函数,对目标函数进行求解,得到优化后的特征选择矩阵,基于优化后的特征选择矩阵确定特征子集,基于特征子集和标记空间矩阵构建训练数据;

5、构建分类器,采用训练数据对分类器进行训练,得到经训练的分类器;

6、获取音乐数据,将音乐数据中与所述特征子集相对应的特征输入到经训练的分类器,得到情感分类结果。

7、作为优选,特征空间矩阵表示为其中为特征空间矩阵中的第i行的元素构成的向量,表示第i个多情感音乐数据的特征,特征包括旋律的振幅、歌词中内容的统计、节奏特征或音色特征,表示实数空间,d表示d维特征,n表示多情感音乐数据的总数,标记空间矩阵包含l个情感分类标签所对应的值,表示为情感分类标签包括惊奇、高兴、放松、安静、悲伤、愤怒,若第i个多情感音乐数据的特征xi与第j个情感分类标签相关联,则标记空间矩阵中对应的元素yij=1,若第i个多情感音乐数据的特征xi与第j个情感分类标签不相关,则标记空间矩阵中第i行第j列的元素yij=0。

8、作为优选,基于特征空间矩阵和特征选择矩阵构造出具有结构化子空间的流形学习框架,通过潜在子空间探索音乐数据的相关性并构造出多情感音乐数据的几何结构,基于标记空间矩阵构造标记相关性模型,根据流形学习框架、几何结构和标记相关性模型构造出目标函数,具体包括:

9、利用特征空间矩阵和特征选择矩阵构建低维嵌入矩阵,表示为:

10、

11、其中,||·||f表示frobenius范数,x表示特征空间矩阵,w表示特征选择矩阵,v表示低维嵌入矩阵;

12、对特征选择矩阵进行稀疏正则化,表示为:

13、

14、利用特征选择矩阵构造线性转换矩阵,表示为:

15、

16、其中,是一个因子矩阵,l为情感分类标签的总数,r表示潜在子空间的大小,f表示线性转换矩阵;

17、对特征选择矩阵施加正交约束,表示为:

18、wtw=il(4)

19、其中,il表示大小为l×l的正定矩阵;

20、集成以上公式构成具有结构化子空间的流形学习框架,如下式所示:

21、

22、通过热核函数构造一个图拉普拉斯矩阵l:

23、l=p-a(6)

24、其中,a表示一个多情感音乐数据的隶属图矩阵,大小为n×n,p为对角矩阵,表示为diag(p1,p2,...,pn),pi表示p中第i行第i列的元素,aim为a中第i行第m列的元素,i=1,2,…,n;

25、探索特征空间矩阵中的任意两个多情感音乐数据的特征的潜在子空间的相关性,构造出多情感音乐数据的几何结构,表示为:

26、

27、其中,||·||2表示范数,xi表示第i个多情感音乐数据的特征,xm表示第m个多情感音乐数据的特征,ir表示大小为r×r的正定矩阵;

28、采用低维预测标记矩阵去拟合标记空间矩阵,确保全局一致性,表示为:

29、

30、其中,v表示低维预测标记矩阵,y表示标记空间矩阵,yij表示y中第i行第j列的元素,vij表示v中第i行第j列的元素,eii表示对角矩阵e中第i行第i列的元素,eii为常数,tr表示迹;

31、采用其中一个多情感音乐数据的低维预测标记去拟合另一个多情感音乐数据的低维预测标记,确保局部一致性,表示为:

32、

33、其中,vi为v中第i行元素构成的矢量,表示第i个多情感音乐数据的低维预测标记,vm为v中第m行元素构成的矢量,表示第m个多情感音乐数据的低维预测标记;

34、结合全局一致性和局部一致性,并对低维预测标记矩阵施加非负约束,构造出标记相关模型,表示为:

35、

36、将流形学习框架、几何结构和标记相关性模型相结合,构造出目标函数,表示为:

37、

38、其中,α、β、γ和λ是权衡参数。

39、作为优选,对目标函数进行求解,得到优化后的特征选择矩阵,基于优化后的特征选择矩阵确定特征子集,具体包括:

40、在目标函数中的和引入范数,表示为:

41、

42、其中,||·||2,1表示范数;

43、设定w=[w1,w2,...,wd]t和xtw-v=[z1,z2,...,zn]t,将目标函数转化为:

44、

45、其中,wh表示w中的第h行的元素构成的向量,h=1,2,…,d,zi表示xtw-v中的第i行的元素构成的向量,i=1,2,…,n,和d分别是两个对角矩阵且其对角元素分别为和d=1/2||wi||2;

46、固定其他变量以求解q:令并基于ftf=ir,可得:

47、

48、固定其他变量以求解w:将q=ftw代入公式(12),可得:

49、

50、其中,g(f)=γtr(ftxlxtf),f(v)=λ(tr[(v-y)te(v-y)]+tr(vtlv)),id表示大小为d×d的正定矩阵;

51、由于(id-fft)(id-fft)=(id-fft),因此公式(14)变换为:

52、

53、令可得:

54、

55、其中,b=h-βfft,求解得到的w即为优化后的特征选择矩阵;

56、固定其他变量以求解f:

57、将公式(15)重写为:

58、

59、将代入公式(17)中,并利用b=bt,可得:

60、

61、当q和v被固定时,f的不相关项被忽略,则公式(18)简化为:

62、

63、根据smw恒等式,b-1=(h-βfft)-1=h-1+βh-1f(ir-βfthf)-1fth-1,基于将公式(19)转化为:

64、

65、其中,c=id-βh和利用公式(20)中βc-1g-γxlxt的特征分解以求解线性转换矩阵f;

66、固定其他变量以求解v:

67、利用公式(18)中的目标函数,将v的不相关项被忽略,目标函数简化为:

68、

69、其中,

70、将公式(21)的拉格朗日函数表示如下:

71、tr(vtsv)+λtr[(v-y)te(v-y)]+tr(ψvt)(22)

72、其中,是约束vij≥0的拉格朗日乘数,根据kkt条件,即可得:

73、

74、其中,(γey)ij表示γey中的第i行第j列的元素,(sv+γev)ij表示sv+γevγey中的第i行第j列的元素,交替优化所有变量,直到目标函数收敛,得到优化后的特征选择矩阵w。

75、作为优选,基于优化后的特征选择矩阵确定特征子集,具体包括:

76、计算优化后的特征选择矩阵中的每一行的元素构成的向量的范数||wi||2,并按照||wi||2(i=1→d)进行降序,选择排名前u%的优化后的特征选择矩阵中的每一行的元素构成的向量作为特征子集。

77、作为优选,分类器包括mlknn分类器。

78、第二方面,本发明提供了一种基于特征选择的多情感音乐数据分类装置,包括:

79、数据获取模块,被配置为获取若干个具有已知情感标签的多情感音乐数据,基于若干个具有已知情感标签的多情感音乐数据构造出特征空间矩阵和标记空间矩阵;

80、特征选择模块,被配置为从特征空间矩阵随机生成特征选择矩阵,基于特征空间矩阵和特征选择矩阵构造出具有结构化子空间的流形学习框架,通过潜在子空间探索音乐数据的相关性并构造出多情感音乐数据的几何结构,基于标记空间矩阵构造标记相关性模型,根据流形学习框架、几何结构和标记相关性模型构造出目标函数,对目标函数进行求解,得到优化后的特征选择矩阵,基于优化后的特征选择矩阵确定特征子集,基于特征子集和标记空间矩阵构建训练数据;

81、模型构建模块,被配置为构建分类器,采用训练数据对分类器进行训练,得到经训练的分类器;

82、分类模块,被配置为获取音乐数据,将音乐数据中与所述特征子集相对应的特征输入到经训练的分类器,得到情感分类结果。

83、第三方面,本发明提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。

84、第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。

85、第五方面,本发明提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。

86、相比于现有技术,本发明具有以下有益效果:

87、(1)本发明提出的基于特征选择的多情感音乐数据分类方法设计了一个具有正交约束的流形框架,以避免由于输入特征和相应标记矩阵之间的拟合方式过于严格而导致的平凡解问题,利用潜在子空间中特征之间的相关性来学习更准确的几何结构,利用标记相关性来确保标记的全局和局部结构信息流形。

88、(2)本发明提出的基于特征选择的多情感音乐数据分类方法关注的是嵌入式的多标记特征选择方法,选择显著性的特征来表征原始多情感音乐数据,从而提高多情感音乐数据的分类性能。

89、(3)本发明提出的基于特征选择的多情感音乐数据分类方法无需依赖学习模型,所提出的特征选择方式适用于多种分类器,无需大量的迭代,降低时间成本和算力。

本文地址:https://www.jishuxx.com/zhuanli/20241120/334843.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。