技术新讯 > 乐器声学设备的制造及制作,分析技术 > 为数字音频文件生成音调兼容的同步神经节拍的制作方法 > 正文

为数字音频文件生成音调兼容的同步神经节拍的制作方法

国知局
2024-06-21 11:58:20

背景技术：

1、在声学中，节拍是频率略有不同的两个声音之间的干扰模式，被视为是音量的周期性变化，其变化速率是两个频率之差。对于单耳节拍，听者在同一只耳朵中或两只耳朵同时听到两个不同的频率。在双耳节拍中，通过不同的耳朵(例如，使用耳机或特别放置的扬声器)分别听到两个不同的频率，并且听者的大脑检测到干扰模式。涉及多个信号的更复杂的干扰模式也可以用于产生各种节拍。

2、某些类型的节拍(例如，单耳节拍、双耳节拍)可用于促进期望的精神状态(例如，提高个人的专注度或注意力)。例如，这样的节拍可用于在用户听节拍时产生神经同步，帮助用户更好地集中注意力或聚精会神。这些节拍常常可以作为独立的音轨(例如仅包含节拍的音轨)来提供。替代地，可以准备已经添加了单耳或双耳节拍定制的音轨(即，已经被创作或生成为包含单耳或双耳节拍的音轨)。在一些情况下，甚至可以提供不在通常为可听声音的频率范围内的节拍。

技术实现思路

1、本公开提出了用于生成神经节拍并将其添加到现有音轨的新的和创新的系统和方法。在第一方面，本公开提供了一种方法，该方法包括接收数字音频文件和要添加到该数字音频文件的神经节拍的节拍频率，并且根据多个参数提取该数字音频文件的多个色度图特征。该方法包括组合多个色度图特征以形成数字音频文件的主要色度图特征，以及从主要色度图特征中提取数字音频文件内多个时间戳处的主音级。基于多个时间戳处的主音级为神经节拍选择多个载波频率，并且基于节拍频率和多个载波频率合成数字音频文件的同步神经节拍。该方法还包括存储以下各项中的至少一者(i)同步神经节拍和(ii)组合了同步神经节拍和数字音频文件的组合音轨。

2、在根据本公开第一方面的实施例中，主要色度图特征包括多个时间戳处的多个音级中的每一个的强度。在一个实施例中，主音级选自于多个音级。在另一实施例中，提取主音级还包括利用隐马尔可夫模型基于多个音级的强度在多个时间戳处为多个音级中的每一个生成概率分布。在又一实施例中，隐马尔可夫模型被配置为优化主音级之间的转变的数量和位置。在替代实施例中，提取主音级还包括在概率分布内识别主音级的序列。

3、在根据本公开第一方面的实施例中，在数字音频文件期间，多个时间戳每500毫秒或更短时间出现一次。

4、在根据本公开第一方面的实施例中，多个色度图特征被线性组合以形成主要色度图特征。

5、在根据本公开第一方面的实施例中，该方法还包括随时间调整同步神经节拍的音量以跟随数字音频文件中编码的音频的音量。在另一实施例中，对同步神经节拍的音量进行标准化包括生成数字音频文件中编码的音频的持续时间的响度简档，并且基于响度简档形成音量曲线。在一个实施例中，该方法包括根据音量曲线调整同步神经节拍的音量。

6、在根据本公开第一方面的实施例中，该方法还包括将节拍频率与数字音频文件内的节奏节拍对齐。在一个实施例中，对齐节拍频率包括估计数字音频文件内的节奏节拍的位置、估计数字音频文件内的音乐节奏、以及根据音乐节奏调整同步神经节拍的时序以将同步神经节拍内的峰值与数字音频文件内的节奏节拍的位置对齐。在一个实施例中，神经节拍是以下各项中的至少一者：(i)双耳节拍和(ii)单耳节拍。

7、在根据本公开第一方面的实施例中，同步神经节拍包括两个或更少的音频通道。

8、在根据本公开第一方面的实施例中，同步神经节拍包括三个或更多的音频通道。

9、在根据本公开第一方面的实施例中，节拍频率大于或等于0.5hz且小于或等于150hz。

10、在根据本公开第一方面的实施例中，该方法还包括经由计算设备并行播放同步神经节拍和数字音频文件。在一个实施例中，该方法还包括向计算设备流式传输同步神经节拍和数字音频文件以供计算设备回放。

11、除非说明书另有明确公开，否则根据上述第一方面的本公开的实施例并不相互排斥：在根据本公开第一方面的其他实施例中，根据本公开第一方面的一个实施例的特征与根据第一方面的另一实施例的特征的组合相组合。

12、在第二方面，提供了一种包括处理器和存储器的系统。存储器可以存储指令，该指令当由处理器执行时，使得处理器执行根据本公开第一方面的方法。在一个实施例中，指令当由处理器执行时，使得处理器接收数字音频文件和要添加到数字音频文件的神经节拍的节拍频率，并且根据多个参数提取数字音频文件的多个色度图特征。这些指令还可以使得处理器组合多个色度图特征以形成数字音频文件的主要色度图特征，从主要色度图特征中提取数字音频文件内多个时间戳处的主音级，以及基于多个时间戳处的主音级为神经节拍选择多个载波频率。这些指令还可以使得处理器基于节拍频率和多个载波频率，合成数字音频文件的同步神经节拍，以及存储以下各项中的至少一者：(i)同步神经节拍和(ii)组合了同步神经节拍和数字音频文件的组合音轨。

13、在根据本公开第二方面的一个实施例中，主要色度图特征包括多个时间戳处的多个音级中的每一个的强度。主音级可以选自于多个音级。

14、在根据第二方面的一个实施例中，存储器存储另外的指令，该另外的指令当在提取主音级时由处理器执行时，使得处理器利用隐马尔可夫模型基于多个音级的强度在多个时间戳处为多个音级中的每一个生成概率分布。

15、除非说明书另有明确公开，否则根据上述第二方面的本公开的实施例并不相互排斥：在根据本公开第二方面的其他实施例中，根据本公开第二方面的一个实施例的特征与根据第二方面的另一实施例的特征的组合相组合。

16、根据本公开第一方面的实施例可以与根据本公开第二方面的实施例相组合。本文中描述的特征和优点并不是都包含在内的，具体而言，鉴于附图和描述，许多附加的特征和优点对于本领域普通技术人员来说将是显而易见的。此外，应注意，说明书中使用的语言主要是为了可读性和指导性目的而选择的，而不是为了限制所公开主题的范围。

技术特征：

1.一种方法，包括：

2.根据权利要求1所述的方法，其中，所述主要色度图特征包括所述多个时间戳处的多个音级中的每一个的强度，并且其中，所述主音级选自于所述多个音级。

3.根据权利要求2所述的方法，其中，提取所述主音级还包括：利用隐马尔可夫模型基于所述多个音级的强度在所述多个时间戳处为所述多个音级中的每一个生成概率分布。

4.根据权利要求3所述的方法，其中，所述隐马尔可夫模型被配置为优化主音级之间的转变的数量和位置。

5.根据权利要求3所述的方法，其中，提取所述主音级还包括在概率分布内识别主音级的序列。

6.根据权利要求1至5中任一项所述的方法，其中，在所述数字音频文件中编码的音频期间，所述多个时间戳每500毫秒或更短时间出现一次。

7.根据权利要求1至5中任一项所述的方法，其中，所述多个色度图特征被线性组合以形成所述主要色度图特征。

8.根据权利要求1至5中任一项所述的方法，还包括：随时间调整所述同步神经节拍的音量以跟随所述数字音频文件中编码的音频的音量。

9.根据权利要求8所述的方法，其中，对所述同步神经节拍的音量进行标准化包括：

10.根据权利要求1至5中任一项所述的方法，还包括将所述节拍频率与所述数字音频文件内的节奏节拍对齐。

11.根据权利要求10所述的方法，其中，对齐所述节拍频率包括：

12.根据权利要求1至5中任一项所述的方法，其中，所述神经节拍为以下各项中的至少一者：(i)双耳节拍，(ii)单耳节拍。

13.根据权利要求1至5中任一项所述的方法，其中，所述同步神经节拍被编码在两个或更少的音频通道中。

14.根据权利要求1至5中任一项所述的方法，其中，所述同步神经节拍被编码在三个或更多的音频通道中。

15.根据权利要求1至5中任一项所述的方法，其中，所述节拍频率大于或等于0.5hz且小于或等于150hz。

16.根据权利要求1至5中任一项所述的方法，还包括经由计算设备同时播放所述同步神经节拍和所述数字音频文件。

17.根据权利要求16所述的方法，还包括向所述计算设备流式传输所述同步神经节拍和所述数字音频文件以供所述计算设备回放。

18.一种系统，包括处理器和存储器，其特征在于，所述存储器被配置为执行根据权利要求1至17中任一项所述的方法的步骤。

19.根据权利要求18所述的系统，其中，所述主要色度图特征包括所述多个时间戳处的多个音级中的每一个的强度，并且其中，所述主音级选自于所述多个音级。

20.根据权利要求19所述的系统，其中，所述存储器存储另外的指令，所述另外的指令当在提取所述主音级时由所述处理器执行时，使得所述处理器利用隐马尔可夫模型基于所述多个音级的强度在所述多个时间戳处为所述多个音级中的每一个生成概率分布。

技术总结提供了用于数字音频文件的改进的神经节拍生成的方法和系统。在一个实施例中，所提供的方法包括接收数字音频文件和神经节拍的节拍频率。色度图特征可以从数字音频文件中提取，并可用于识别数字音频文件内多个时间戳处的主音级。可以基于主音级来选择数字音频文件内不同时间周期的多个载波频率。可以基于多个载波频率中的节拍频率为数字音频文件合成神经节拍。神经节拍可以被存储和/或可与数字音频文件组合以生成可以被存储的组合音轨。技术研发人员：艾里奥·昆顿受保护的技术使用者：尤尼维瑟国际音乐公司技术研发日：技术公布日：2024/6/13