融合特征相似性的偏多标签音乐风格特征选择方法
- 国知局
- 2024-06-21 11:48:13
本发明属于机器学习和模式识别领域,涉及一种融合特征相似性的偏多标签音乐风格特征选择方法。
背景技术:
1、音乐风格分类是一种对音乐作品进行归纳和区分的方式,通过特定的音乐元素和风格特征来划分不同的音乐类型。这种分类系统有助于理解和描述音乐的多样性,帮助听众更好地选择自己喜欢的音乐。在音乐风格分类中,有许多不同的流派和类型,每一种都有独特的声音和表达方式。古典音乐是一种通过复杂的结构和精致的编曲来表达情感和思想的音乐形式,而流行音乐则更注重通俗、易懂的旋律和歌词,是大众喜爱的主流音乐。此外,爵士乐以其复杂的和声和即兴演奏而著称,电子音乐则通过电子设备和技术创造出富有未来感的声音。民谣音乐通常以吉他为主,强调故事性和真实感,而摇滚音乐则以强烈的节奏和吉他演奏为特色,表达对社会和个体的态度。总体而言,音乐风格分类是一个丰富多彩的领域,反映了不同文化、时代和个体对音乐的独特理解和创造。这种分类系统帮助我们更好地欣赏和理解音乐的多元性,使我们能够在广阔的音乐世界中找到自己喜欢的声音。音乐风格分类将音乐按照其风格添加对应的标签,通过音乐风格标签,音乐平台能更好地将音乐推荐到感兴趣的用户,提升用户的体验感。音乐风格分类中也常用到多标签分类,在多标签音乐风格分类中,一首歌可能被标注上“金属”“朋克”“摇滚”“流行”等风格。在实际的数据集搜集过程中,往往不能得到完全准确无误的风格标签。因为实际收集的数据大多从网上爬取,而网络中的标记者通常会出现一些不可靠的标注者,不可避免导致一些标注出错。这就意味着,数据收集时在网上爬取的一些标签存在一些人为的因素导致一首歌标上不属于它的风格,仅其中某些标注者给出的标记是有效的。例如,一首歌或一段音乐,在网络上的标签可能有七个标签,分别是“民谣”“电子”“流行”“独立”“爵士”和“古典”。但是,一个专业人士仔细辨认这段音乐可以发现这些标签有许多错误。其中,只有“民谣”“电子”“流行”和“独立”是有效的标注。在含有错误标签的多标签的音乐风格分类数据集中进行分类,我们将其称为偏多标签音乐风格分类。
2、在传统的音乐风格分类多标签学习任务中,使用特征选择方法对抽取的音乐特征进行缩减后,往往能有效提高学习算法的准确度。而以往的理论和实践都表明使用合适的特征选择方法能很好地降低学习任务难度并提高模型的准确率。多标签特征选择技术通过减少冗余的音乐特征,去除无关分类任务的音乐特征,降低学习器消耗的时间和硬件资源。并且由于无关和冗余特征被消除,去除了这些特征对多标签学习器的影响,学习性能得到改善。
3、在偏多标签音乐风格分类的场景下,直接利用多标签特征选择算法忽略了噪声标签对对特征选择结果的影响,导致错误选择与噪声音乐风格标签相关的特征。这样选择出来的特征缺乏可信度。现有的偏多标签特征选择方法较少,一种算法是将偏多标签的候选标签分为两部分,并分别通过核范数和和l1范数限制从特征空间映射到标签空间的系数矩阵,然后使用流形正则让相似的实例有相似的标签。
技术实现思路
1、本发明针对目前的技术不足,提出一种融合特征相似性的偏多标签音乐风格特征选择方法。
2、本发明的具体步骤如下:
3、步骤1:抽取音乐特征获取偏多标签音乐分类数据集m并指定的特征子集维度k,其中,集合m中有n个音乐样本,q个标签,d个音乐特征;
4、步骤2:对偏多标签音乐分类数据集m进行划分,将偏多标签音乐分类数据集m分为训练样本集mt和测试样本集mp,这里,使用x表示训练样本集的特征矩阵,(x)ij表示第i个样本的第j个特征值,y表示训练样本的候选标签指示矩阵,(y)ij表示第j个样本的候选标签是否存在第i个标签,1则存在,0则不存在;
5、步骤3:计算每个样本xg的局部格拉姆矩阵表示特征相似性。样本xg的局部格拉姆wg∈rdxd矩阵计算方式如下:
6、
7、其中,δ是邻域粒度的阈值,δ是距离度量公式。
8、步骤4:定义一个偏多标签分类器,目标函数如下
9、
10、其中,w和s分别是映射到真实标签和噪声标签的映射矩阵。
11、步骤5:将特征相似性分别限制映射矩阵w和s,这里使用流行正则的思想,定义最终目标函数
12、
13、其中,lg=dg+wg,dg是wg的每一行元素相加形成的对角矩阵。
14、步骤7:使用交替求解法最小化目标函数求解w和s,对w得每一个列向量计算二范数得到特征的打分值,然后选取最大的k个特征。
15、步骤8:利用选取的k个特征对训练样本集mt和测试样本集mp进行降维,分别得到降维后训练样本集mt′和降维后的测试样本集mp′,然后将降维后的训练样本集mt′输入多标签k近邻(ml-knn)模型进行训练,得到训练后的多标签k近邻模型(ml-knn)模型。
16、本发明的有益效果是:本发明融合特征相识性构造了一个偏多标签音乐风格特征选择方法,包括:对多标签数据集进行预处理,其中包括缺失值填充,数据离散化等;利用偏多标签音乐风格特征选择方法对处理过的数据集进行特征筛选,得到筛选后的特征集。将得到的特征数据集输入到多标签k近邻(mlknn)模型中,得到数据集优化后的多标签k近邻(mlknn)模型。本发明通过将候选音乐风格标签分为真实音乐风格标签和噪声音乐风格标签,然后分别利用特征相似性限制映射到真实标签的系数矩阵w和映射到噪声标签的系数矩阵s,并利用一个偏多标签分类器限制w和s的和矩阵h,最后,通过w矩阵给特征打分选择相关的音乐风格特征。其降低问题难度,提升了多标签k近邻(mlknn)模型的性能。
技术特征:1.一种融合特征相似性的偏多标签音乐风格特征选择方法,包括以下步骤:
2.根据权利要求1所述的一种融合特征相似性的偏多标签音乐风格特征选择方法,其特征在于,步骤5中
3.根据权利要求1所述的一种融合特征相似性的偏多标签音乐风格特征选择方法,其特征在于,步骤6中,训练mlknn分类器的步骤包括:
技术总结本发明属于机器学习和模式识别领域,涉及一种融合特征相似性的偏多标签音乐风格特征选择方法。本发明融合特征相识性构造了一个偏多标签音乐风格特征选择方法,其通过将候选音乐风格标签分为真实音乐风格标签和噪声音乐风格标签,然后分别利用特征相似性限制映射到真实标签的系数矩阵W和映射到噪声标签的系数矩阵S,并利用一个偏多标签分类器限制W和S的和矩阵H,最后,通过W矩阵给特征打分选择相关的音乐风格特征。其降低问题难度,提升了多标签k近邻(MLKNN)模型的性能。技术研发人员:杨涛,刘海波,马希骜受保护的技术使用者:浙江工商大学技术研发日:技术公布日:2024/4/29本文地址:https://www.jishuxx.com/zhuanli/20240618/23655.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表