技术新讯 > 乐器声学设备的制造及制作,分析技术 > 符号音乐生成模型训练、符号音乐生成方法及相关设备与流程  >  正文

符号音乐生成模型训练、符号音乐生成方法及相关设备与流程

  • 国知局
  • 2024-06-21 11:58:17

本技术实施例涉及符号音乐生成领域,更具体的,是符号音乐生成模型训练方法、符号音乐生成方法、计算机设备以及计算机可读存储介质。

背景技术:

1、随着深度学习的发展,符号音乐生成模型及其变体在符号音乐生成中尤为重要。符号音乐是指用符号表示音乐的一种方式,它将音乐转化为一系列的音符、节拍、和弦等符号,可以方便地编辑、修改和传播,同时也可以方便地进行分析和研究。在符号音乐生成领域中,符号音乐生成模型可以利用深度学习技术,通过学习大量的符号音乐数据,生成新的符号音乐作品,从而可以帮助音乐家、作曲家和音乐爱好者快速地生成新的音乐作品,同时也可以为音乐教育和音乐研究提供有力的工具。

2、现有的符号音乐生成模型训练的方法是,获得原始数据,原始数据比如包括钢琴演奏的midi文件和音频数据,对原始数据进行标记,得到中间数据(比如包含多个事件的midi文件),将中间数据输入符号音乐生成模型,由符号音乐生成模型确定中间数据的音乐特征和规律,得到符号音乐生成模型输出的预测目标数据,当所述预测目标数据与中间数据之间的损失满足收敛条件时,得到训练完成的符号音乐生成模型。

3、但是,在训练过程中,只是将原始数据(midi文件和音频数据)对应的中间数据输入符号音乐生成模型进行训练,只考虑了原始数据的标记,得到的模型只能生成符合标记化规则的符号音乐,无法生成目标风格标签对应符号音乐,因此,也无法生成目标风格标签对应的音频音乐。

技术实现思路

1、本技术实施例提供了一种符号音乐生成模型训练方法、符号音乐生成方法、计算机设备以及计算机可读存储介质,用于在可以生成符合特定风格音乐的符号音乐的情况下,进行符号音乐生成模型训练。

2、第一方面,本技术实施例提供了一种符号音乐生成模型训练方法,包括:

3、获得训练样本,所述训练样本包括符号音乐样本和所述符号音乐样本对应的风格标签;所述符号音乐样本包括每个时间步对应的复合特征序列;所述复合特征序列表征所述时间步的音符对应在各个维度的全局音乐风格;

4、将所述符号音乐样本的风格标签和每个时间步对应的复合特征序列输入符号音乐生成模型,获得所述风格标签对应的预测符号音乐;

5、当所述预测符号音乐与所述符号音乐样本之间的损失满足收敛条件时,得到训练完成的符号音乐生成模型。

6、可选的,所述将所述所述符号音乐样本的风格标签和每个时间步对应的复合特征序列输入符号音乐生成模型,获得所述风格标签对应的预测符号音乐,包括:

7、将所述符号音乐样本的风格标签和每个时间步对应的复合特征序列输入符号音乐生成模型,由所述符号音乐生成模型基于所述风格标签和所述符号音乐样本中各个时间步之前时间步的复合特征序列,得到各个所述时间步的预测复合特征序列,并基于各个所述时间步的预测复合特征序列生成所述风格标签对应的预测符号音乐。

8、可选的,所述由所述符号音乐生成模型基于所述风格标签和所述符号音乐样本中各个时间步之前时间步的复合特征序列,得到各个所述时间步的预测复合特征序列,包括:

9、将各个所述时间步之前时间步的复合特征序列映射至向量空间,得到各个所述时间步之前时间步的目标嵌入向量;

10、基于所述风格标签、各个所述时间步之前时间步的目标嵌入向量,得到各个所述时间步的至少一个初始复合特征序列;其中每个初始复合特征序列对应有概率值;

11、基于各个所述时间步的每个初始复合特征序列对应的概率值,在各个所述时间步的至少一个初始复合特征序列中,确定各个所述时间步的预测复合特征序列。

12、可选的,所述将各个所述时间步之前时间步的复合特征序列映射至向量空间,得到各个所述时间步之前时间步的目标嵌入向量,包括:

13、确定各个所述时间步之前时间步的复合特征序列对应的嵌入向量和各个所述时间步之前时间步的位置嵌入向量;

14、对各个所述时间步之前时间步的复合特征序列对应的嵌入向量和各个所述时间步之前时间步的位置嵌入向量进行相加,得到各个所述时间步之前时间步的目标嵌入向量。

15、可选的,所述基于各个所述时间步的每个初始复合特征序列对应的概率值,在各个所述时间步的至少一个初始复合特征序列中,确定各个所述时间步的预测复合特征序列,包括:

16、将各个所述时间步的每个初始复合特征序列对应的概率值分别除以目标温度值,得到各个所述时间步的每个初始复合特征序列对应的商值;

17、基于各个所述时间步的每个初始复合特征序列对应的商值,在各个所述时间步的至少一个初始复合特征序列中,确定各个所述时间步的预测复合特征序列。

18、可选的,所述基于各个所述时间步的每个初始复合特征序列对应的概率值,在各个所述时间步的至少一个初始复合特征序列中,确定各个所述时间步的预测复合特征序列,包括:

19、在各个所述时间步的至少一个初始复合特征序列中,确定各个所述时间步的概率值大于或等于预设概率阈值的至少一个备选复合特征序列;

20、在各个所述时间步的至少一个备选复合特征序列中进行随机采样,以确定各个所述时间步的预测复合特征序列。

21、可选的,所述基于各个所述时间步的每个初始复合特征序列对应的概率值,在各个所述时间步的至少一个初始复合特征序列中,确定各个所述时间步的预测复合特征序列,包括:

22、在各个所述时间步的至少一个初始复合特征序列中,确定各个所述时间步的累积概率超过预设累计概率阈值的最小备选复合特征序列集合;其中所述最小备选复合特征序列集合包括多个备选复合特征序列;

23、在各个所述时间步的最小备选复合特征序列集合中进行随机采样,以确定各个所述时间步的预测复合特征序列。

24、可选的,所述获得训练样本,包括:

25、获得目标符号音乐;其中所述目标符号音乐包括每个时间步对应的复合特征序列;所述复合特征序列表征所述时间步的音符对应在各个维度的全局音乐风格;

26、将所述目标符号音乐输入预先训练的风格识别模型,由所述风格识别模型确定所述目标符号音乐对应的目标风格标签后,得到所述风格识别模型输出的所述目标符号音乐对应的目标风格标签;

27、综合所述目标符号音乐和所述目标符号音乐对应的目标风格标签,得到所述训练样本。

28、第二方面,本技术实施例提供了一种符号音乐生成方法,包括:

29、获得目标风格标签;

30、将所述目标风格标签输入如第一方面所述的符号音乐生成模型,由所述符号音乐生成模型基于所述目标风格标签得到所述目标风格标签对应的符号音乐。

31、第三方面,本技术实施例提供了一种计算机设备,包括:

32、中央处理器,存储器,输入输出接口,有线或无线网络接口以及电源;

33、所述存储器为短暂存储存储器或持久存储存储器;

34、所述中央处理器配置为与所述存储器通信,并执行所述存储器中的指令操作以执行前述符号音乐生成模型训练方法或符号音乐生成方法。

35、第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质包括指令,当指令在计算机上运行时,使得计算机执行前述符号音乐生成模型训练方法或符号音乐生成方法。

36、第五方面,本技术实施例提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行前述符号音乐生成模型训练方法或符号音乐生成方法。

37、从以上技术方案可以看出,本技术实施例具有以下优点:可以在训练过程中,将符号音乐样本对应的风格标签和每个时间步对应的复合特征序列输入符号音乐生成模型进行训练,符号音乐生成模型可以学习符号音乐样本的风格标签和复合特征序列之间的关系,并将其编码为模型的内部表示。当输入目标风格标签时,得到的符号音乐生成模型可以使用这些内部表示来生成符合特定风格的符号音乐,从而可以基于目标风格标签的符号音乐,生成目标风格标签对应的音频音乐。

本文地址:https://www.jishuxx.com/zhuanli/20240618/24796.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。