技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种音频数据处理方法、装置和电子设备与流程 > 正文

一种音频数据处理方法、装置和电子设备与流程

国知局
2024-06-21 11:41:22

本公开涉及人机交互，尤其涉及一种音频数据处理方法、装置和电子设备。

背景技术：

1、随着越来越多音乐节目的热播，很多老歌重新编曲填词，刮起了一阵新的热门风暴。但是这类歌曲很多都是现场(live)版本的多媒体文件，包括很多无关声音，如：口哨声、掌声、评委点评声等等，导致用户无法听清楚歌唱者的声音，极大地影响了用户观感。

2、因此，如何基于用户的需求生成满足用户要求的歌曲，成为了一个亟待解决的问题。

技术实现思路

1、为了解决上述技术问题，本公开提供了一种音频数据处理方法、装置和电子设备。

2、本公开的技术方案如下：

3、第一方面，本公开提供一种显示设备，包括：处理器，被配置为响应于对指定多媒体文件的选择操作，控制显示器显示指定多媒体文件的声音波形图；其中，指定多媒体文件为现场版本的多媒体文件，指定多媒体文件包括指定音频数据，声音波形图包括至少一个声音波形，一个声音波形对应一个指定音频数据中的声音；处理器，还被配置为响应于对目标波形的编辑操作，生成编辑后的目标波形；其中，目标波形包括至少一个声音波形，编辑操作包括删除操作、响度调节操作、音色调节操作、播放速度调节操作、时间戳调节操作中的一项或者多项；处理器，还被配置为基于指定多媒体文件和编辑后的目标波形进行混合，生成混合多媒体文件。

4、第二方面，本公开提供一种音频数据处理方法，包括：响应于对指定多媒体文件的选择操作，显示指定多媒体文件的声音波形图；其中，指定多媒体文件为现场版本的多媒体文件，指定多媒体文件包括指定音频数据，声音波形图包括至少一个声音波形，一个声音波形对应一个指定音频数据中的声音；响应于对目标波形的编辑操作，生成编辑后的目标波形；其中，目标波形包括至少一个声音波形，编辑操作包括删除操作、响度调节操作、音色调节操作、播放速度调节操作、时间戳调节操作中的一项或者多项；基于指定多媒体文件和编辑后的目标波形进行混合，生成混合多媒体文件。

5、第三方面，本公开提供一种电子设备，包括：存储器和处理器，存储器用于存储计算机程序；处理器用于在执行计算机程序时，使得电子设备实现如第二方面提供的任一项的音频数据处理方法。

6、第四方面，本发明提供一种计算机可读存储介质，包括：计算机可读存储介质上存储计算机程序，计算机程序被处理器执行如第二方面提供的任一项的音频数据处理方法。

7、第五方面，本发明提供一种计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行如第二方面提供的任一项的音频数据处理方法。

8、需要说明的是，上述计算机指令可以全部或者部分存储在第一计算机可读存储介质上。其中，第一计算机可读存储介质可以与显示设备的处理器封装在一起的，也可以与显示设备的处理器单独封装，本公开对此不作限定。

9、本公开中第二方面、第三方面、第四方面以及第五方面的描述，可以参考第一方面的详细描述；并且，第二方面、第三方面、第四方面以及第五方面的描述的有益效果，可以参考第一方面的有益效果分析，此处不再赘述。

10、在本公开中，上述显示设备的名字对设备或功能模块本身不构成限定，在实际实现中，这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本公开类似，属于本公开权利要求及其等同技术的范围之内。

11、本公开的这些方面或其他方面在以下的描述中会更加简明易懂。

12、本公开提供的技术方案与现有技术相比具有如下优点：

13、本公开提供的音频数据处理方法，显示设备响应于对指定多媒体文件的选择操作，显示指定多媒体文件的声音波形图。这样，用户就可以基于显示设备显示的声音波形图，了解到指定多媒体文件中包含的所有的声音，以及每个声音对应的声音波形。之后，用户便可以对指定多媒体文件中需要进行编辑的声音波形进行编辑操作，此时显示设备响应于对目标波形的编辑操作(如：删除操作、响度调节操作、音色调节操作、播放速度调节操作、时间戳调节操作中的一项或者多项)，生成编辑后的目标波形。之后，显示设备基于指定多媒体文件和编辑后的目标波形进行混合，生成混合多媒体文件。如此，用户便可以对指定多媒体文件中需要进行编辑的声音波形进行编辑，从而生成用户需要的混合多媒体文件，如称为定制版本的多媒体文件，解决了如何基于用户的需求生成满足用户要求的歌曲的问题。

技术特征：

1.一种显示设备，其特征在于，包括：

2.根据权利要求1所述的显示设备，其特征在于，所述处理器，进一步被配置为响应于对指定多媒体文件的选择操作，对所述指定音频数据进行音源分离，得到所述指定音频数据包含的至少一个声音波形；

3.根据权利要求1所述的显示设备，其特征在于，所述显示设备还包括通信器；

4.根据权利要求3所述的显示设备，其特征在于，所述处理器，还被配置为响应于对所述指定多媒体文件的歌曲栏中共享版立即听的控件的选择操作，播放所述共享多媒体文件。

5.根据权利要求3所述的显示设备，其特征在于，所述处理器，进一步被配置为对所述混合多媒体文件中存在编辑操作每一帧执行如下操作：按照所述编辑操作对应的操作总数，将操作总数大于或等于操作阈值的编辑操作作为目标操作。

6.根据权利要求5所述的显示设备，其特征在于，所述操作阈值等于所述编辑操作对应的操作总数的二分之一。

7.根据权利要求1所述的显示设备，其特征在于，所述处理器，进一步被配置为基于多模态的生成算法对所述指定多媒体文件和所述编辑后的目标波形进行混合，生成混合多媒体文件。

8.根据权利要求1-7任一项所述的显示设备，其特征在于，所述指定多媒体文件还包括：所述指定音频数据对应的歌词。

9.一种音频数据处理方法，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，包括：所述计算机可读存储介质上存储有计算机程序，当所述计算机程序被计算设备执行时，使得所述计算设备实现权利要求9所述的音频数据处理方法。

技术总结本公开涉及人机交互技术领域，尤其涉及一种音频数据处理方法、装置和电子设备，用于解决如何基于用户的需求生成满足用户要求的歌曲的问题。该方法包括响应于对指定多媒体文件的选择操作，显示指定多媒体文件的声音波形图；其中，指定多媒体文件为现场版本的多媒体文件，指定多媒体文件包括指定音频数据，声音波形图包括至少一个声音波形，一个声音波形对应一个指定音频数据中的声音；响应于对目标波形的编辑操作，生成编辑后的目标波形；基于指定多媒体文件和编辑后的目标波形进行混合，生成混合多媒体文件。技术研发人员：方依云,巨荣辉,范颜岩受保护的技术使用者：海信电子科技（武汉）有限公司技术研发日：技术公布日：2024/4/7