技术新讯 > 乐器声学设备的制造及制作,分析技术 > 曲谱识别方法、装置、电子设备及介质与流程 > 正文

曲谱识别方法、装置、电子设备及介质与流程

国知局
2024-06-21 11:32:21

本申请涉及数据处理，尤其涉及曲谱识别方法、装置、电子设备介质。

背景技术：

1、在一些场景中，如歌唱合成模型的训练场景，需要用到音频数据(也称歌唱数据、歌曲、音乐)的曲谱信息。目前，确定音频数据的曲谱信息的方法，通常是需要专业性极强的懂得乐理的人进行人工标注，但是采用人工标注的形式确定音频数的曲谱信息需要耗费大量人力资源，且效率较低。

技术实现思路

1、本申请实施例提供了一种曲谱识别方法、装置、电子设备及介质，有助于提升提取音频数据的曲谱信息的效率，降低人力成本。

2、一方面，本申请实施例公开了一种曲谱识别方法，所述方法包括：

3、获取待处理音频数据，并确定所述待处理音频数据中每个音频帧的基频信息；

4、基于所述每个音频帧的基频信息确定所述待处理音频数据中的至少一个音符和每个音符的初始音符时间边界；

5、确定所述待处理音频数据中各个音素的音素时间边界，并根据所述各个音素的音素时间边界与所述各个音素的音素类型信息确定至少一个修正时间点；

6、根据所述至少一个修正时间点对所述每个音符的初始音符时间边界进行修正，得到所述每个音符的目标音符时间边界，并根据所述至少一个音符和所述每个音符的目标音符时间边界确定所述待处理音频数据的曲谱信息。

7、一方面，本申请实施例公开了一种曲谱识别装置，所述装置包括：

8、获取单元，用于获取待处理音频数据，并确定所述待处理音频数据中每个音频帧的基频信息；

9、处理单元，用于基于所述每个音频帧的基频信息确定所述待处理音频数据中的至少一个音符和每个音符的初始音符时间边界；

10、所述处理单元，还用于确定所述待处理音频数据中各个音素的音素时间边界，并根据所述各个音素的音素时间边界与所述各个音素的音素类型信息确定至少一个修正时间点；

11、所述处理单元，还用于根据所述至少一个修正时间点对所述每个音符的初始音符时间边界进行修正，得到所述每个音符的目标音符时间边界，并根据所述至少一个音符和所述每个音符的目标音符时间边界确定所述待处理音频数据的曲谱信息。

12、一方面，本申请实施例提供了一种电子设备，电子设备包括处理器、存储器，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于执行如下步骤：

13、获取待处理音频数据，并确定所述待处理音频数据中每个音频帧的基频信息；

14、基于所述每个音频帧的基频信息确定所述待处理音频数据中的至少一个音符和每个音符的初始音符时间边界；

15、确定所述待处理音频数据中各个音素的音素时间边界，并根据所述各个音素的音素时间边界与所述各个音素的音素类型信息确定至少一个修正时间点；

16、根据所述至少一个修正时间点对所述每个音符的初始音符时间边界进行修正，得到所述每个音符的目标音符时间边界，并根据所述至少一个音符和所述每个音符的目标音符时间边界确定所述待处理音频数据的曲谱信息。

17、一方面，本申请实施例提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序指令，计算机程序指令被处理器执行时，用于执行如下步骤：

18、获取待处理音频数据，并确定所述待处理音频数据中每个音频帧的基频信息；

19、基于所述每个音频帧的基频信息确定所述待处理音频数据中的至少一个音符和每个音符的初始音符时间边界；

20、确定所述待处理音频数据中各个音素的音素时间边界，并根据所述各个音素的音素时间边界与所述各个音素的音素类型信息确定至少一个修正时间点；

21、根据所述至少一个修正时间点对所述每个音符的初始音符时间边界进行修正，得到所述每个音符的目标音符时间边界，并根据所述至少一个音符和所述每个音符的目标音符时间边界确定所述待处理音频数据的曲谱信息。

22、一方面，本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令被处理器执行时可实现上述一方面提供的方法。

23、采用本申请实施例，能够根据待处理音频数据中每个音频帧的基频信息，确定待处理音频数据中的至少一个音符和每个音符的初始音符时间边界，并且，可以基于根据待处理音频数据中的各个音素的音素时间边界与音素类型信息确定至少一个修正时间点，从而可以基于修正时间点对每个音符的初始音符时间边界进行修正，得到每个音符的目标音符时间边界，使得基于基频信息得到的音符时间边界能够更准确，进而根据至少一个音符和每个音符的目标音符时间边界得到待处理音频数据的曲谱信息。由此可以通过确定待处理音频数据中的音素类型信息来修正基于基频信息确定的初始音符时间边界，使得最终得到的曲谱信息中的目标音符时间边界能够更准确地表示每个音符的持续时间，并且，本申请能够基于待处理音频数据自动识别其中的音符以及每个音符的时间边界，以得到待处理音频数据的曲谱信息，满足了曲谱识别的自动化、智能化需求，有助于提升提取音频数据的曲谱信息的效率，降低人力成本。

技术特征：

1.一种曲谱识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述方法，其特征在于，所述获取待处理音频数据，包括：

3.根据权利要求1所述方法，其特征在于，所述确定所述待处理音频数据中各个音素的音素时间边界，包括：

4.根据权利要求1所述方法，其特征在于，所述音素类型信息用于指示音素为卡拍音素或不卡拍音素；所述根据所述各个音素的音素时间边界与所述各个音素的音素类型信息确定至少一个修正时间点，包括：

5.根据权利要求1所述方法，其特征在于，所述基于所述每个音频帧的基频信息确定所述待处理音频数据中的至少一个音符和每个音符的初始音符时间边界，包括：

6.根据权利要求1所述方法，其特征在于，所述根据所述至少一个修正时间点对所述每个音符的初始音符时间边界进行修正，得到所述每个音符的目标音符时间边界，包括：

7.根据权利要求1所述方法，其特征在于，所述根据所述至少一个音符和所述每个音符的目标音符时间边界确定所述待处理音频数据的曲谱信息，包括：

8.一种曲谱识别装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括处理器、存储器，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。

技术总结本申请实施例公开了曲谱识别方法、装置、电子设备及介质，可应用于数据处理技术领域。其中方法包括：确定待处理音频数据中每个音频帧的基频信息；基于每个音频帧的基频信息确定待处理音频数据中的至少一个音符和每个音符的初始音符时间边界；确定待处理音频数据中各个音素的音素时间边界，并根据各个音素的音素时间边界与各个音素的音素类型信息确定至少一个修正时间点；根据至少一个修正时间点对每个音符的初始音符时间边界进行修正，得到每个音符的目标音符时间边界，以确定待处理音频数据的曲谱信息。采用本申请实施例，有助于提升提取音频数据的曲谱信息的效率，降低人力成本。本申请实施例还可应用于云技术、人工智能等各种场景。技术研发人员：孙士茹,靳源受保护的技术使用者：书行科技（北京）有限公司技术研发日：技术公布日：2024/3/4