技术新讯 > 乐器声学设备的制造及制作,分析技术 > 数据处理方法、装置、设备、程序产品及存储介质与流程  >  正文

数据处理方法、装置、设备、程序产品及存储介质与流程

  • 国知局
  • 2024-06-21 11:32:44

本申请涉及云技术和人工智能,尤其涉及一种数据处理方法、装置、设备、程序产品及存储介质。

背景技术:

1、目前的乐曲创作方式一般是基于人工创作实现,需要人工基于创作灵感才能创作出乐曲对应的音频。然而人工创作的方式需要耗费大量的时间和精力,而人的时间和精力是有限的,因此会导致乐曲创作效率较低,进而导致音频生成效率较低。

技术实现思路

1、本申请实施例提供一种数据处理方法、装置、设备、程序产品及存储介质,可以生成指定情感类型(如目标情感类型)下的音频,并提高音频的生成效率。

2、第一方面,本申请提供一种数据处理方法,包括:

3、获取需要生成的音频的目标情感类型,并获取用于进行音频预测的n个节拍点;

4、调用音频预测网络分别在每个节拍点预测目标情感类型关联的音频事件集;任一节拍点对应的音频事件集包含任一节拍点对应的音符类型事件、音符特征事件或音频片段的片段特征事件中的至少一种;任一节拍点对应的音符特征事件用于指示任一节拍点上音符发音的特征,任一节拍点对应的音频片段是指任一节拍点与任一节拍点的下一节拍点间的音频片段,任一节拍点对应音频片段的片段特征事件用于指示任一节拍点对应音频片段发音的特征;

5、基于每个节拍点分别对应的音频事件集生成目标情感类型下的目标音频;目标音频具有n个节拍点。

6、第二方面,本申请提供一种数据处理装置,包括:

7、数据获取单元,用于获取需要生成的音频的目标情感类型,并获取用于进行音频预测的n个节拍点;

8、数据预测单元,用于调用音频预测网络分别在每个节拍点预测目标情感类型关联的音频事件集;任一节拍点对应的音频事件集包含任一节拍点对应的音符类型事件、音符特征事件或音频片段的片段特征事件中的至少一种;任一节拍点对应的音符特征事件用于指示任一节拍点上音符发音的特征,任一节拍点对应的音频片段是指任一节拍点与任一节拍点的下一节拍点间的音频片段,任一节拍点对应音频片段的片段特征事件用于指示任一节拍点对应音频片段发音的特征;

9、音频生成单元,用于基于每个节拍点分别对应的音频事件集生成目标情感类型下的目标音频;目标音频具有n个节拍点。

10、第三方面,本申请提供了一种计算机设备,包括:处理器、存储器、网络接口;

11、上述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以使包含该处理器的计算机设备执行上述数据处理方法。

12、第四方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行上述数据处理方法。

13、第五方面,本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请第一方面中的各种可选方式中提供的数据处理方法。

14、本申请实施例中,通过获取需要生成的音频的目标情感类型,可以调用音频预测网络预测分别在多个节拍点预测目标情感类型关联的音频事件集,从而确定每个节拍点处是否存在音符,进而可以基于每个节拍点分别对应的音频事件集生成目标情感类型下的目标音频。在进行音频生成的过程中,只需要输入目标情感类型,就可以调用音频预测网络预测每个节拍点分别对应的音频事件集,从而可以基于每个节拍点分别对应的音频事件集生成目标情感类型下的目标音频,无需人工进行乐曲和音频创作,只需要指定情感类型(如目标情感类型)就可以生成指定的情感类型下的音频,可以提高音频的生成效率。

技术特征:

1.一种数据处理方法,其特征在于,该方法包括:

2.根据权利要求1所述的方法,其特征在于,调用所述音频预测网络在所述任一节拍点预测所述目标情感类型关联的音符类型事件的流程,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据在所述任一节拍点预测的针对每种音符音高的第一概率、针对每种音符时长的第二概率及针对每种音符力度的第三概率,确定所述任一节拍点对应的音符类型事件,包括:

4.根据权利要求1所述的方法,其特征在于,所述任一节拍点对应音频片段的片段特征事件包含所述任一节拍点对应音频片段的音频速度;所述调用所述音频预测网络在所述任一节拍点预测音频片段的片段特征事件的流程,包括:

5.根据权利要求1所述的方法,其特征在于,所述任一节拍点对应的音符特征事件包含所述任一节拍点上音符关联的乐器类型事件;调用所述音频预测网络预测所述任一节拍点对应的音符特征事件的流程包括:

6.根据权利要求1所述的方法,其特征在于,所述任一节拍点对应的音符特征事件包含所述任一节拍点上音符关联的和弦类型事件;调用所述音频预测网络预测所述任一节拍点对应的音符特征事件的流程包括:

7.根据权利要求1所述的方法,其特征在于,所述基于所述每个节拍点分别对应的音频事件集生成所述目标情感类型下的目标音频,包括:

8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述n个样本节拍点中任一个表示为目标样本节拍点;所述基于所述每个样本节拍点分别对应的标记音频事件集和样本音频事件集,分别确定所述初始音频预测网络在所述每个样本节拍点处的预测偏差,包括:

10.一种数据处理装置,其特征在于,包括:

11.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-9任一项所述的方法。

13.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令被处理器执行时实现如权利要求1-9任一项所述的方法。

技术总结本申请实施例公开了一种数据处理方法、装置、设备、程序产品及存储介质,涉及云技术和人工智能技术,其中,方法包括:获取需要生成的音频的目标情感类型,并获取用于进行音频预测的N个节拍点;调用音频预测网络分别在每个节拍点预测目标情感类型关联的音频事件集;任一节拍点对应的音频事件集包含任一节拍点对应的音符类型事件、音符特征事件或音频片段的片段特征事件中的至少一种;任一节拍点对应的音符特征事件用于指示任一节拍点上音符发音的特征;基于每个节拍点分别对应的音频事件集生成目标情感类型下的目标音频;目标音频具有N个节拍点。采用本申请实施例,可以生成目标情感类型下的音频,并提高音频的生成效率。技术研发人员:袁微受保护的技术使用者:腾讯科技(深圳)有限公司技术研发日:技术公布日:2024/3/5

本文地址:https://www.jishuxx.com/zhuanli/20240618/22136.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。