一种基于动态窗口word2vec模型的音乐推荐方法及系统
- 国知局
- 2024-09-14 14:40:41
本发明属于自然语言处理,尤其是基于动态窗口word2vec模型的音乐推荐方法及系统。
背景技术:
1、自然语言处理(natural language processing, nlp)是人工智能的一个重要分支,涉及使计算机能够理解、解释和生成人类语言的技术。近年来,深度学习在nlp领域取得了显著进展,尤其是word2vec模型的提出,极大地推动了这一领域的发展。word2vec模型通过将词汇映射到连续向量空间,使得计算机能够更好地处理和理解语言数据。
2、现有的word2vec模型主要针对文本数据设计,采用固定窗口大小来处理所有类型的输入数据,当应用于音乐数据时,特别是在跨语言或跨风格的音乐分析中,由于音乐数据包含的语义和结构复杂度远高于普通文本数据,因此word2vec模型的适用性和通用性受到挑战,影响最终的音乐语义分析精度,影响最终特征的提取。
技术实现思路
1、发明目的:本发明的目的是提供一种基于动态窗口word2vec模型的音乐推荐方法及系统,能够根据音乐内容的语义密度和结构复杂度动态调整窗口大小,使得模型能更准确地捕捉音乐元素之间的关系,如旋律与力度之间的相互作用,进而提高音乐语义分析的精确度。
2、技术方案:本发明所述的基于动态窗口word2vec模型的音乐推荐方法,建立音乐推荐模型,从音乐文件中提取音乐元素的特征向量输入所述音乐推荐模型,得到相似音乐预测结果;
3、所述音乐推荐模型为基于动态窗口的word2vec模型,其目标函数为:
4、;
5、其中 ω t是 t时刻的音乐元素的特征向量, ω t + j是预测的 t+j时刻的音乐元素的特征向量, t=1 ,2 ,…,t, w ( t )是 t时刻的动态窗口的大小, t、 j代表时刻值;
6、通过连续两个音符的音高变化量、时值变化量和力度变化量的加权和,计算所述动态窗口的大小。动态窗口的大小决定了从当前音乐元素特征可以考虑多远的上下文信息,这个窗口大小可以根据音乐数据的复杂性动态调整,以更有效的捕捉音乐的结构和关系。
7、进一步地,所述从音乐文件中提取音乐元素的特征向量包括:将音乐文件转换为midi格式,从midi音乐文件中提取音高、时长、力度和音符并分别进行onehot编码后求和,得到音乐元素的特征向量。
8、进一步地,所述通过连续两个音符的音高变化量、时值变化量和力度变化量的加权和,计算所述动态窗口的大小包括:
9、 w= max (3 , min( c , 10)) ;
10、其中w为动态窗口的大小,c为连续两个音符的音高变化量、时值变化量和力度变化量的加权和。连续两个音符的音高变化量、时值变化量和力度变化量的加权和能够表征音乐内容的复杂性,根据音乐内容的复杂性自动调整窗口大小,增强了模型的适应性和灵活性,使其能更准确地捕捉音乐的语义和结构特征。
11、进一步地,连续两个音符的音高变化量、时值变化量和力度变化量的加权和c的计算方法为:
12、;
13、其中,、和分别表示连续两个音符的音高变化量、时值变化量和力度变化量, ω p 、 ω s和 ω c分别是、和的权重系数。
14、本发明所述的基于动态窗口word2vec模型的音乐推荐系统,包括音乐推荐模型,从音乐文件中提取音乐元素的特征向量输入所述音乐推荐模型,得到相似音乐预测结果;
15、所述音乐推荐模型为基于动态窗口的word2vec模型,其目标函数为:
16、;
17、其中 ω t是 t时刻的音乐元素的特征向量, ω t + j是预测的 t+j时刻的音乐元素的特征向量, t=1 ,2 ,…,t, w ( t )是 t时刻的动态窗口的大小, t、 j代表时刻值;
18、通过连续两个音符的音高变化量、时值变化量和力度变化量的加权和,计算所述动态窗口的大小。动态窗口的大小决定了从当前音乐元素特征可以考虑多远的上下文文信息,这个窗口大小可以根据音乐数据的复杂性动态调整,以更有效的捕捉音乐的结构和关系。
19、进一步地,所述从音乐文件中提取音乐元素的特征向量包括:将音乐文件转换为midi格式,从midi音乐文件中提取音高、时长、力度和音符并分别进行onehot编码后求和,得到音乐元素的特征向量。
20、进一步地,所述通过连续两个音符的音高变化量、时值变化量和力度变化量的加权和,计算所述动态窗口的大小包括:
21、 w= max (3 , min( c , 10)) ;
22、其中w为动态窗口的大小,c为连续两个音符的音高变化量、时值变化量和力度变化量的加权和。连续两个音符的音高变化量、时值变化量和力度变化量的加权和能够表征音乐内容的复杂性,根据音乐内容的复杂性自动调整窗口大小,增强了模型的适应性和灵活性,使其能更准确地捕捉音乐的语义和结构特征。
23、进一步地,连续两个音符的音高变化量、时值变化量和力度变化量的加权和c的计算方法为:
24、;
25、其中,、和分别表示连续两个音符的音高变化量、时值变化量和力度变化量, ω p 、 ω s和 ω c分别是、和的权重系数。
26、本发明所述的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于动态窗口word2vec模型的音乐推荐方法。
27、本发明所述的计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于动态窗口word2vec模型的音乐推荐方法。
28、有益效果:与现有技术相比,本发明的优点在于:
29、(1)针对现有技术中固定窗口大小的局限性,本发明提供一种能够根据音乐内容的语义密度和结构复杂度动态调整窗口大小的方法,使得模型能更准确地捕捉音乐元素之间的关系,如旋律与力度之间的相互作用,进而提高音乐语义分析的精确度;通过自动分析音乐的局部复杂性(如旋律跳跃、节奏变化和力度转换),本发明能够在需要捕捉更多上下文信息的复杂区域扩大其窗口,而在结构简单的部分则缩小窗口;这种灵活性使得模型不仅节省了计算资源,还能更准确地理解和反映音乐作品的语义和情感,能够显著提高模型在音乐数据上的训练效率和词向量的质量;
30、(2)现有技术在调整窗口大小时往往计算复杂度较高,效率低下。本发明通过引入更高效的自适应算法,减少了不必要的计算量,从而显著提高处理大规模音乐数据集时的效率,减少内存消耗和处理时间。
31、(3)针对现有技术在跨音乐风格或语言的应用中表现不足的问题,本发明通过针对音乐数据的特性优化算法,使得模型不仅适用于多种音乐风格,还能适应不同语言的音乐作品,增强模型的通用性。
32、(4)本发明可以为用户提供更符合个人口味的音乐推荐,用户可以发现更多与其音乐品味相符的新歌曲和艺术家,从而提升用户满意度和平台的用户粘性;同时还适用于音乐教育和分析,帮助音乐学者和学生更深入地理解音乐作品的结构和风格;此外本发明也为音乐创作者和研究人员提供了一种新的工具,以探索不同音乐元素之间的关系和影响,激发创新的音乐创作思路。
本文地址:https://www.jishuxx.com/zhuanli/20240914/295469.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表