生成和混合音频编配的制作方法
- 国知局
- 2024-07-31 19:15:42
本公开涉及生成音频编配(audio arrangement)。提供了生成音频编配的各种措施(例如,方法、系统和计算机程序)以及在生成音频编配中使用的各种措施(例如,方法、系统和计算机程序)。具体地但不排他地,本公开涉及生成式音乐创作和渲染音频。
背景技术:
1、所有音频文件(例如音乐)都是静态数据流。特别是,一旦音乐被录制、混合和渲染,除非专家使用适当的工具,否则音乐不能以任何有意义的方式以另一种形式或上下文动态变化、实时交互、重复使用或个性化。因此,这种音乐可以被认为是“静态的”。静态音乐无法为交互式和沉浸式技术和体验的世界提供动力。大多数现有系统不容易促进音乐的控制和个性化。
2、us-a1-2010/0050854涉及多媒体序列的自动或半自动合成。每个音轨都有预定数量的变化。创作是随机生成的。感兴趣的读者还可以参考us-a1-2018/076913、wo-a1-2017/068032和us20190164528。
技术实现思路
1、根据第一实施方案,提供了用于生成音频编配的方法,该方法包括:接收对具有一个或多个目标音频编配特性的音频编配的请求;基于所述一个或多个目标音频编配特性来识别一个或多个目标音频属性;选择第一音频数据,所述第一音频数据具有第一组音频属性,所述第一组音频属性包括所识别的一个或多个目标音频属性中的至少一些目标音频属性;选择第二音频数据,所述第二音频数据具有第二组音频属性,所述第二组音频属性包括所识别的一个或多个目标音频属性中的至少一些目标音频属性;以及输出:一个或多个混合音频编配,所述一个或多个混合音频编配已经至少由已使用自动音频混合程序混合的所选的第一音频数据和第二音频数据生成;和/或能用于生成所述一个或多个混合音频编配的数据。
2、根据第二实施方案,提供了用于生成音频编配的方法,该方法包括:选择模板来为混合音频编配定义允许的音频数据,所述允许的音频数据具有与所述混合音频编配兼容的一组一个或多个目标音频属性;选择第一音频数据,所述第一音频数据具有第一组音频属性,所述第一组音频属性包括所识别的一个或多个目标音频属性中的至少一些目标音频属性;选择第二音频数据,所述第二音频数据具有第二组音频属性,所述第二组音频属性包括所识别的一个或多个目标音频属性中的至少一些目标音频属性;生成一个或多个混合音频编配和/或能用于生成所述一个或多个混合音频编配的数据,所述一个或多个混合音频编配是通过使用自动音频混合程序混合所选择的第一音频数据和第二音频数据而生成的;以及输出所述一种或多种生成的混合音频编配和/或能用于生成所述一个或多个混合音频编配的数据。
3、根据第三实施方案,提供了用于生成音频编配的方法,该方法包括:分析视频数据和/或给定的音频数据;基于对所述视频数据和/或给定的音频数据的分析识别一个或多个目标音频编配强度;基于所述一个或多个目标音频编配强度来识别一个或多个目标音频属性;选择第一音频数据,所述第一音频数据具有第一组音频属性,所述第一组音频属性包括所识别的一个或多个目标音频属性中的至少一些目标音频属性;选择第二音频数据,所述第二音频数据具有第二组音频属性,所述第二组音频属性包括所识别的一个或多个目标音频属性中的至少一些目标音频属性;以及生成一个或多个混合音频编配和/或能用于生成所述一个或多个混合音频编配的数据,所述一个或多个混合音频编配是通过混合所选择的第一音频数据和第二音频数据生成的;以及输出所述一个或多个生成的混合音频编配和/或能用于生成所述一个或多个混合音频编配的数据。
4、根据第四实施方案,提供了被配置为执行根据第一实施方案至第三实施方案中的任一个实施方案的方法的系统。
5、根据第五实施方案,提供了计算机程序,该计算机程序被布置为在被执行时执行根据第一实施方案至第三实施方案中的任一个实施方案的方法。
技术特征:1.用于生成音频编配的方法,该方法包括:
2.根据权利要求1所述的方法,其中,所述一个或多个目标音频编配特性包括目标音频编配强度。
3.根据权利要求2所述的方法,其中,在已经生成所述一个或多个混合音频编配之后,所述目标音频编配强度是能修改的。
4.根据权利要求2或3所述的方法,包括:
5.根据权利要求2至4中的任一项所述的方法,其中,所述第一组音频属性包括第一创作者指定的频谱权重系数,其中所述第二组音频属性包括第二创作者指定的频谱权重系数,并且其中所述第一音频数据的选择和所述第二音频数据的选择分别基于所述第一创作者指定的频谱权重系数和第二创作者指定的频谱权重系数。
6.根据权利要求1至5中的任一项所述的方法,包括:使用所述自动音频混合程序混合所选择的所述第一音频数据和所选择的所述第二音频数据以生成所述一个或多个混合音频编配。
7.根据权利要求1至6中的任一项所述的方法,其中,所述一个或多个目标音频编配特性包括目标音频编配持续时间。
8.根据权利要求7所述的方法,其中,所述第一组音频属性包括所述第一音频数据的第一持续时间,其中所述第二组音频属性包括所述第二音频数据的第二持续时间,并且其中所述第一音频数据的选择和所述第二音频数据的选择分别基于所述第一持续时间和第二持续时间。
9.根据权利要求1至8中的任一项所述的方法,其中,所述一个或多个目标音频编配特性包括流派、主题、风格和/或情绪。
10.根据权利要求1至9中的任一项所述的方法,包括:
11.根据权利要求1至10中的任一项所述的方法,包括:使用自动音频归一化程序导出所述第一音频数据和/或第二音频数据。
12.根据权利要求1至11中的任一项所述的方法,包括:使用自动音频母版制作程序导出所述第一音频数据和/或第二音频数据。
13.根据权利要求1至12中的任一项所述的方法,其中,独立于在选择所述第一音频数据和第二音频数据之后接收到的任何用户输入来混合所述一个或多个音频编配。
14.根据权利要求1至13中的任一项所述的方法,其中,所述第一组和/或第二组音频属性包括至少一个禁止音频属性,所述至少一个禁止音频属性指示不与所述第一音频数据和/或第二音频数据一起使用的音频数据的属性,并且其中所述第一音频数据和/或第二音频数据的选择是基于所述至少一个禁止音频属性。
15.根据权利要求14所述的方法,其中,基于具有所述至少一个禁止音频属性中的至少一些禁止音频属性的另外的音频数据而忽略所述另外的音频数据以供选择用于所述音频编配中。
16.根据权利要求1至15中的任一项所述的方法,其中,所述第一音频数据和/或第二音频数据包括:
17.根据权利要求1至16中的任一项所述的方法,其中,在所述音频编配中仅使用所述第一音频数据和/或第二音频数据的部分。
18.根据权利要求1至17中的任一项所述的方法,其中,所述第一音频数据源自第一创作者并且所述第二音频数据源自第二不同的创作者。
19.根据权利要求1至18中的任一项所述的方法,其中,所述音频编配进一步基于视频数据。
20.根据权利要求19所述的方法,包括:分析所述视频数据。
21.根据权利要求20所述的方法,包括:基于对所述视频数据的分析来识别所述一个或多个目标音频编配特性。
22.根据权利要求1至21中的任一项所述的方法,包括:输出视频数据以伴随所述一个或多个混合音频编配和/或能用于生成所述一个或多个混合音频编配的数据。
23.根据权利要求1至22中的任一项所述的方法,其中,识别所述一个或多个目标音频属性包括将所述一个或多个目标音频编配特性映射到所述一个或多个目标音频属性。
24.根据权利要求1至23中的任一项所述的方法,其中,所述输出包括流式传输所述一个或多个混合音频编配。
25.用于生成音频编配的方法,该方法包括:
26.用于生成音频编配的方法,该方法包括:
27.系统,被配置为执行根据权利要求1至26中的任一项所述的方法。
28.计算机程序,被布置为在被执行时执行根据权利要求1至26中的任一项所述的方法。
技术总结接收对具有一个或多个目标音频编配特性的音频编配的请求。基于一个或多个目标音频编配特性来识别一个或多个目标音频属性。选择第一音频数据。第一音频数据具有第一组音频属性,第一组音频属性包括所识别的一个或多个目标音频属性中的至少一些目标音频属性。选择第二音频数据。第二音频数据具有第二组音频属性,第二组音频属性包括所识别的一个或多个目标音频属性中的至少一些目标音频属性。输出一个或多个混合音频编配和/或输出可用于生成一个或多个混合音频编配的数据。一个或多个混合音频编配是通过使用自动音频混合程序混合至少所选择的第一音频数据和第二音频数据而生成的。技术研发人员:L·哲尔泽克,D·基里亚库迪斯,S·沃德,I·费希尔受保护的技术使用者:思考得科技股份有限公司技术研发日:技术公布日:2024/1/16本文地址:https://www.jishuxx.com/zhuanli/20240731/182068.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表