技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频处理方法、装置、设备、介质和程序产品与流程 > 正文

音频处理方法、装置、设备、介质和程序产品与流程

国知局
2024-06-21 11:36:07

本申请实施例涉及人工智能领域，特别涉及一种音频处理方法、装置、设备、介质和程序产品。

背景技术：

1、在获取文本内容对应的多段音频内容后，通常要将多段音频内容拼接后得到用于连贯表述文本内容的完整音频。

2、在相关技术中，通常需要人工对多段音频内容进行音效调整后拼接得到完整音频。

3、然而在相关技术中，由于人工处理音频内容的方式较为繁琐，使得音频处理效率较低。

技术实现思路

1、本申请实施例提供了一种音频处理方法、装置、设备、介质和程序产品，能够自动对不同音频内容进行音效处理和音频拼接，从而提高音频处理的效率和准确率。所述技术方案如下：

2、一方面，提供了一种音频处理方法，所述方法包括：

3、获取目标文本内容对应的第一音频数据和第二音频数据，所述第一音频数据中包括第一音频内容和第一位置标签，所述第二音频数据中包括第二音频内容和第二位置标签，所述第一位置标签用于指示所述第一音频内容对应的第一文本内容在所述目标文本内容中的位置，所述第二位置标签用于指示所述第二音频内容对应的第二文本内容在所述目标文本内容中的位置；

4、对所述第一音频内容和所述第二音频内容进行音效同步处理，得到所述第一音频内容对应的第一同步音频和所述第二音频内容对应的第二同步音频，其中，所述音效同步处理包括去混响处理，所述去混响处理是指去除音频内容中的混响噪声；

5、基于所述第一位置标签和所述第二位置标签将所述第一同步音频和所述第二平衡结果进行音频拼接，得到音频拼接结果。

6、另一方面，提供了一种音频处理装置，所述装置包括：

7、获取模块，用于获取目标文本内容对应的第一音频数据和第二音频数据，所述第一音频数据中包括第一音频内容和第一位置标签，所述第二音频数据中包括第二音频内容和第二位置标签，所述第一位置标签用于指示所述第一音频内容对应的第一文本内容在所述目标文本内容中的位置，所述第二位置标签用于指示所述第二音频内容对应的第二文本内容在所述目标文本内容中的位置；

8、处理模块，用于对所述第一音频内容和所述第二音频内容进行音效同步处理，得到所述第一音频内容对应的第一同步音频和所述第二音频内容对应的第二同步音频，其中，所述音效同步处理包括去混响处理，所述去混响处理是指去除音频内容中的混响噪声；

9、拼接模块，用于基于所述第一位置标签和所述第二位置标签将所述第一同步音频和所述第二同步音频进行音频拼接，得到音频拼接结果。

10、另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述的音频处理方法。

11、另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的音频处理方法。

12、另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中任一所述的音频处理方法。

13、本申请实施例提供的技术方案带来的有益效果至少包括：

14、在获取目标文本内容对应的第一音频数据和第二音频数据后，通过对第一音频数据中的第一音频内容以及第二音频数据中的第二音频内容进行去混响处理后得到第一同步音频和第二同步音频，基于第一音频数据中的第一位置标签和第二音频数据中的第二位置标签将第一同步音频和第二同步音频进行音频拼接，最终得到音频拼接结果。也即，通过对不同音频内容自动去除混响噪声后得到多个混响效果相同的同步音频，再基于位置标签将多个同步音频进行音频拼接，不仅提高了音频处理效率，还能使得拼接得到的音频拼接结果中的多段音频内容的音效保持一致。

技术特征：

1.一种音频处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述音效同步处理中还包括音量值调整处理，所述音量值调整处理是指调整音频内容中的音频节点的音量值；

3.根据权利要求1所述的方法，其特征在于，所述对所述第一音频内容和所述第二音频内容进行去混响处理，得到所述第一音频内容对应的第一干声音频和所述第二音频内容对应的第二干声音频，包括：

4.根据权利要求3所述的方法，其特征在于，所述将所述第一音频内容和所述第二音频内容输入预先训练得到的去混响模型，输出得到所述第一去混响音频所述第二去混响音频之前，还包括：

5.根据权利要求2所述的方法，其特征在于，所述对所述第一干声音频和所述第二干声音频进行音量值调整处理，得到所述第一干声音频对应的第一同步音频和所述第二干声音频对应的第二同步音频，包括：

6.根据权利要求1至5任一所述的方法，其特征在于，所述基于所述第一位置标签和所述第二位置标签将所述第一同步音频和所述第二同步音频进行音频拼接，得到音频拼接结果之后，还包括：

7.根据权利要求1至3任一所述的方法，其特征在于，所述第一音频数据中包括多段对白音频数据，所述第二音频数据中包括旁白音频数据；

8.根据权利要求7所述的方法，其特征在于，所述主播信息数据中包括多个配音主播分别对应的性别标签和音色标签；

9.根据权利要求7所述的方法，其特征在于，所述获取多个主播终端发送的所述对白音频内容，包括：

10.一种音频处理装置，其特征在于，所述装置包括：

11.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一段程序，所述至少一段程序由所述处理器加载并执行以实现如权利要求1至9任一所述的音频处理方法。

12.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一段程序，所述至少一段程序由处理器加载并执行以实现如权利要求1至9任一所述的音频处理方法。

13.一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序被处理器执行时实现如权利要求1至9任一所述的音频处理方法。

技术总结本申请公开了一种音频处理方法、装置、设备、介质和程序产品，涉及人工智能领域。该方法包括如下步骤：获取目标文本内容对应的第一音频数据和第二音频数据；对所述第一音频内容和所述第二音频内容进行音效同步处理，得到所述第一音频内容对应的第一同步音频和所述第二音频内容对应的第二同步音频；基于所述第一位置标签和所述第二位置标签将所述第一同步音频和所述第二同步音频进行音频拼接，得到音频拼接结果。通过对不同音频内容自动去除混响噪声后得到多个混响效果相同的同步音频，再基于位置标签将多个同步音频进行音频拼接，不仅提高了音频处理效率，还能使得拼接得到的音频拼接结果中的多段音频内容的音效保持一致。技术研发人员：黄杰雄受保护的技术使用者：广州酷狗计算机科技有限公司技术研发日：技术公布日：2024/3/12