技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音量调节方法、装置及设备与流程 > 正文

音量调节方法、装置及设备与流程

国知局
2024-06-21 11:51:21

本申请属于音视频处理，具体涉及一种音量调节方法、装置及设备。

背景技术：

1、由于音视频制作人员的技术水平以及制作方法的多样性，导致用户在利用电子设备播放音视频时，通常会遇到音量不均的问题，即音视频中某些人物的音量过高，其他人物的音量过低。

2、在不同的观看环境下，由于音视频中人物的音量不均，用户为了确保能清晰听到每一帧音视频中每个人物的对话，需要频繁地手动调节音量，操作繁琐。

技术实现思路

1、本申请实施例的目的是提供一种音量调节方法、装置及设备，能够解决相关技术中因观看环境不同以及音视频中人物的音量不均，需要用户频繁手动调节音量，操作繁琐的问题。

2、第一方面，本申请实施例提供了一种音量调节方法，包括：

3、在检测到针对对象进行音量调整的情况下，获取对象对应的音视频在第一时刻的第一音频信号、第一滑动时间窗口内各第一时间点的第一环境噪声数据以及对象在第二滑动时间窗口内各第二时间点的第一音量，第一滑动时间窗口和第二滑动时间窗口均为第一时刻之前的时间窗口；

4、在第一音频信号的第一声纹特征与参考声纹特征匹配的情况下，根据各第一环境噪声数据确定音视频的观看环境在第一时刻的环境噪声特征，参考声纹特征为对象的声纹特征；

5、根据对象在各第二时间点的第一音量，确定用户在第一时刻的音量偏好系数；

6、根据环境噪声特征和音量偏好系数，将第一音频信号在第一时刻的第二音量调节至第三音量。

7、第二方面，本申请实施例提供了一种音量调节装置，包括：获取模块、确定模块和调节模块；

8、获取模块，用于在检测到针对对象进行音量调整的情况下，获取对象对应的音视频在第一时刻的第一音频信号、第一滑动时间窗口内各第一时间点的第一环境噪声数据以及对象在第二滑动时间窗口内各第二时间点的第一音量，第一滑动时间窗口和第二滑动时间窗口均为第一时刻之前的时间窗口；

9、确定模块，用于在第一音频信号的第一声纹特征与参考声纹特征匹配的情况下，根据各第一环境噪声数据确定音视频的观看环境在第一时刻的环境噪声特征，参考声纹特征为对象的声纹特征；

10、确定模块，还用于根据目标对象在各第二时间点的第一音量，确定用户在第一时刻的音量偏好系数；

11、调节模块，用于根据环境噪声特征和音量偏好系数，将第一音频信号在第一时刻的第二音量调节至第三音量。

12、第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器和存储器，存储器存储可在处理器上运行的程序或指令，程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

13、第四方面，本申请实施例提供了一种可读存储介质，可读存储介质上存储程序或指令，程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

14、第五方面，本申请实施例提供了一种芯片，芯片包括处理器和通信接口，通信接口和处理器耦合，处理器用于运行程序或指令，实现如第一方面所述的方法的步骤。

15、第六方面，本申请实施例提供了一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现如第一方面所述的方法的步骤。

16、本申请实施例在检测到针对对象进行音量调整且第一音频信号的第一声纹特征与对象的参考声纹特征匹配的情况下，可以基于各第一环境噪声数据确定第一时刻的环境噪声特征，以及根据对象在各第二时间点的第一音量，确定用户在第一时刻的音量偏好系数，并根据环境噪声特征和音量偏好系数，将第一音频信号在第一时刻的第二音量自动地调节至第三音量。也即，本申请实施例可以基于环境噪声和用户的偏好，自适应地调节不同观看环境下对象的音量，使得在不同的观看环境下，均可以为用户提供最佳的听觉效果，无需用户再因观看环境不同以及人物的音量不均频繁手动调节音量，从而减少了用户的操作，提升了用户观赏的流畅性。

技术特征：

1.一种音量调节方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取所述对象对应的音视频在第一时刻的第一音频信号、第一滑动时间窗口内各第一时间点的第一环境噪声数据以及所述对象在第二滑动时间窗口内各第二时间点的第一音量之前，所述方法还包括：

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述对象在各所述第二时间点的第一音量，确定用户在所述第一时刻的音量偏好系数，包括：

4.根据权利要求1或2所述的方法，其特征在于，所述环境噪声特征包括噪声频谱特征；

5.根据权利要求4所述的方法，其特征在于，所述环境噪声特征还包括第一噪声强度；

6.根据权利要求1或2所述的方法，其特征在于，所述环境噪声特征包括噪声频谱特征和第一噪声强度；

7.根据权利要求6所述的方法，其特征在于，所述根据所述噪声频谱特征和所述第一噪声强度，生成第一加权系数，包括：

8.根据权利要求6所述的方法，其特征在于，所述根据所述噪声补偿增益和所述音量偏好系数，将所述第二音量调节至所述第三音量，包括：

9.根据权利要求8所述的方法，其特征在于，所述确定所述噪声补偿增益与参考增益的第一差值，以及所述音量偏好系数与所述参考增益的第二差值之前，所述方法还包括：

10.根据权利要求8所述的方法，其特征在于，所述利用所述目标调整增益将所述第二音量调节至所述第三音量，包括：

11.一种音量调节装置，其特征在于，包括：获取模块、确定模块和调节模块；

12.根据权利要求11所述的装置，其特征在于，所述环境噪声特征包括第一噪声强度；

13.根据权利要求11所述的装置，其特征在于，所述环境噪声特征包括噪声频谱特征和第一噪声强度；

14.根据权利要求13所述的装置，其特征在于，所述生成模块，具体用于：

15.一种电子设备，其特征在于，包括：处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至10任一项所述方法的步骤。

技术总结本申请公开了一种音量调节方法、装置及设备，属于音频处理技术领域。音量调节方法包括：在检测到针对对象进行音量调整的情况下，获取音视频在第一时刻的第一音频信号、第一滑动时间窗口内各第一时间点的第一环境噪声数据以及对象在第二滑动时间窗口内各第二时间点的第一音量；在第一音频信号的第一声纹特征与参考声纹特征匹配的情况下，根据各第一环境噪声数据确定第一时刻的环境噪声特征；根据对象在各第二时间点的第一音量，确定用户在第一时刻的音量偏好系数；根据环境噪声特征和音量偏好系数，将第一音频信号在第一时刻的第二音量调节至第三音量。技术研发人员：李恒受保护的技术使用者：维沃移动通信有限公司技术研发日：技术公布日：2024/5/12