技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频增强方法、装置、计算设备集群及可读存储介质与流程  >  正文

音频增强方法、装置、计算设备集群及可读存储介质与流程

  • 国知局
  • 2024-06-21 11:50:26

本技术涉及计算机,尤其涉及一种音频增强方法、装置、计算设备集群及可读存储介质。

背景技术:

1、随着计算机技术的发展,通过网络进行线上沟通成为一种较为普遍的沟通方式。例如,人们通过网络进行线上会议或者线上教学,等等。因此,对于依托音频实现沟通的场景,亟需一种音频增强方法,以通过对音频进行增强,使得沟通双方能够清晰的获知对方的讲话内容,保证沟通效果,从而为用户提供优质的音频体验。

技术实现思路

1、本技术提出一种音频增强方法、装置、计算设备集群及可读存储介质,用于根据与声学环境适配的音频调整参数,对在该声学环境下获取到的音频进行增强,提高音频增强效果。

2、第一方面,提供了一种音频增强方法,该方法应用于云服务器,云服务器包括获取模块和增强模块。该方法包括:获取模块获取语音会议中目标对象所在的声学环境的环境信息;然后,增强模块根据获取的环境信息,从多个音频调整参数中获取环境信息对应的音频调整参数,多个音频调整参数中的各个音频调整参数对应的环境信息不同;之后,增强模块根据获取的音频调整参数对在该声学环境下获取到的音频进行增强。示例性地,该方法还包括:增强模块将增强后的音频发送至语音会议中另一对象。

3、该方法中,由于音频调整参数与声学环境的环境信息相对应,音频调整参数与声学环境的适配度较高,从而对该声学环境下获取到的音频进行增强的效果较好。在该方法应用于云会议软件的情况下,在保证音频增强效果的同时,用户可以自行购买扬声器、麦克风和屏幕等视频沟通设备,有助于用户搭建低成本的视频会议室。

4、在一种可能的实现方式中,获取模块获取语音会议中目标对象所在的声学环境的环境信息之前,该方法还包括:获取模块根据操作指令为语音会议开启音频增强功能。从而在开启音频增强功能之后,执行获取语音会议中目标对象所在的声学环境的环境信息的操作,进而执行后续的获取音频调整参数,实现对该声学环境下获取到的音频进行增强。

5、在一种可能的实现方式中,获取模块获取语音会议中目标对象所在的声学环境的环境信息,包括:获取模块获取图像采集设备发送的语音会议中目标对象所在的声学环境的第一图像信息,图像采集设备位于该声学环境中;获取模块对第一图像信息进行识别,根据得到的第一识别结果获取声学环境的环境信息。相较于用户手动输入声学环境的环境信息的方式,通过对第一图像信息进行识别以获取声学环境的环境信息的方式无需用户手动操作,获取环境信息的方式较为简便。

6、在一种可能的实现方式中,获取模块获取语音会议中目标对象所在的声学环境的环境信息,包括:获取模块接收用户输入的配置信息,配置信息包括语音会议中目标对象所在的声学环境的环境信息;获取模块根据配置信息获取声学环境的环境信息。该方法中,声学环境的环境信息也可以根据用户输入的配置信息得到,获取环境信息的方式较为灵活。

7、在一种可能的实现方式中,声学环境的环境信息包括声学环境的空间大小信息或声学环境的吸音材质信息中的至少一种。声学环境的环境信息的种类较为多样,再有,多种环境信息有助于提高获取到的音频调整参数与声学环境的适配度,从而提高根据音频调整参数对在该声学环境下获取到的音频的增强效果。

8、在一种可能的实现方式中,在声学环境的环境信息包括声学环境的空间大小信息的情况下,获取模块获取语音会议中目标对象所在的声学环境的环境信息,包括:获取模块获取距离探测设备发送的距离探测信息,距离探测信息用于指示语音会议中目标对象所在的声学环境的多个空间分隔界面之间的距离,距离探测设备位于声学环境中;获取模块基于距离探测信息获取声学环境的空间大小信息。声学环境的空间大小信息也可以通过距离探测信息获取,空间大小信息的获取方式较为灵活。

9、在一种可能的实现方式中,音频调整参数包括回声消除子参数、去混响子参数或自动增益控制子参数中的至少一种。音频调整参数的种类较为丰富,在获取到多种音频调整参数的情况下,可以对获取到的音频进行多种类型的增强,例如对音频中的回声进行消除、对音频中的混响进行消除、以及对音频的响度进行调整,从而获得较好的音频增强效果。

10、在一种可能的实现方式中,多个音频调整参数包括多个自动增益控制子参数,不同的自动增益控制子参数对应声学环境的环境信息所包括的不同的空间大小信息,任一个自动增益控制子参数对应的响度增强能力与该任一个自动增益控制子参数对应的空间大小信息指示的空间大小成正比。从而,在获取到的声学环境信息包括空间大小信息的情况下,获取到的自动增益控制子参数能够与空间大小信息相适配,根据自动增益控制子参数对音频的响度进行增强的效果较好,从而对音频进行增强的效果较好。

11、在一种可能的实现方式中,多个音频调整参数还包括多个回声消除子参数,不同的回声消除子参数对应声学环境的环境信息所包括的不同的空间大小信息和吸音材质信息的组合;任一个回声消除子参数对应的回声消除能力与该任一个回声消除子参数对应的空间大小信息指示的空间大小成正比,且与该任一个回声消除子参数对应的吸音材质信息指示的吸音能力成反比。从而,在获取到的声学环境信息包括空间大小信息和吸音材质信息的情况下,获取到的回声消除子参数能够与空间大小信息和吸音材质信息的组合相适配,根据回声消除子参数对音频中的回声进行消除的效果较好,从而对音频进行增强的效果较好。

12、在一种可能的实现方式中,多个音频调整参数还包括多个去混响子参数,不同的去混响子参数对应声学环境的环境信息所包括的不同的空间大小信息和吸音材质信息的组合;任一个去混响子参数对应的混响消除能力与该任一个回声消除子参数对应的空间大小信息指示的空间大小成正比,且与该任一个去混响子参数对应的吸音材质信息指示的吸音能力成反比。从而,在获取到的声学环境信息包括空间大小信息和吸音材质信息的情况下,获取到的去混响子参数能够与空间大小信息和吸音材质信息的组合相适配,根据去混响子参数对音频中的混响进行消除的效果较好,从而对音频进行增强的效果较好。

13、第二方面,提供了一种音频增强装置,该装置应用于云服务器,该装置包括:

14、获取模块,用于获取语音会议中目标对象所在的声学环境的环境信息;

15、增强模块,用于根据环境信息,从多个音频调整参数中获取环境信息对应的音频调整参数,多个音频调整参数中的各个音频调整参数对应的环境信息不同;

16、增强模块,还用于根据音频调整参数对在声学环境下获取到的音频进行增强。

17、在一种可能的实现方式中,增强模块,还用于将增强后的音频发送至语音会议中的另一对象。

18、在一种可能的实现方式中,获取模块,还用于在获取环境信息之前,根据操作指令为语音会议开启音频增强功能。

19、在一种可能的实现方式中,获取模块,用于获取图像采集设备发送的语音会议中目标对象所在的声学环境的第一图像信息,图像采集设备位于声学环境中;对第一图像信息进行识别,根据得到的第一识别结果获取声学环境的环境信息。

20、在一种可能的实现方式中,获取模块,用于接收用户输入的配置信息,配置信息包括语音会议中目标对象所在的声学环境的环境信息;根据配置信息获取声学环境的环境信息。

21、在一种可能的实现方式中,声学环境的环境信息包括声学环境的空间大小信息或声学环境的吸音材质信息中的至少一种。

22、在一种可能的实现方式中,在声学环境的环境信息包括声学环境的空间大小信息的情况下,获取模块,用于获取距离探测设备发送的距离探测信息,距离探测信息用于指示语音会议中目标对象所在的声学环境的多个空间分隔界面之间的距离,距离探测设备位于声学环境中;基于距离探测信息获取声学环境的空间大小信息。

23、在一种可能的实现方式中,音频调整参数包括回声消除子参数、去混响子参数或自动增益控制子参数中的至少一种。

24、在一种可能的实现方式中,多个音频调整参数包括多个自动增益控制子参数,不同的自动增益控制子参数对应声学环境的环境信息所包括的不同的空间大小信息,任一个自动增益控制子参数对应的响度增强能力与该任一个自动增益控制子参数对应的空间大小信息指示的空间大小成正比。

25、在一种可能的实现方式中,多个音频调整参数还包括多个回声消除子参数,不同的回声消除子参数对应声学环境的环境信息所包括的不同的空间大小信息和吸音材质信息的组合;任一个回声消除子参数对应的回声消除能力与该任一个回声消除子参数对应的空间大小信息指示的空间大小成正比,且与该任一个回声消除子参数对应的吸音材质信息指示的吸音能力成反比。

26、在一种可能的实现方式中,多个音频调整参数还包括多个去混响子参数,不同的去混响子参数对应声学环境的环境信息所包括的不同的空间大小信息和吸音材质信息的组合;任一个去混响子参数对应的混响消除能力与该任一个回声消除子参数对应的空间大小信息指示的空间大小成正比,且与该任一个去混响子参数对应的吸音材质信息指示的吸音能力成反比。

27、第三方面,提供了一种计算设备集群,该计算设备集群包括至少一个计算设备,各个计算设备包括处理器和存储器,至少一个计算设备的处理器包括获取模块和增强模块;至少一个计算设备的处理器用于执行该至少一个计算设备的存储器中存储的指令,以使得该计算设备集群执行第一方面中任一的音频增强方法。

28、第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质包括计算机程序指令,计算机程序指令由计算设备集群执行,计算设备集群包括获取模块和增强模块,当计算机程序指令由计算设备集群执行时,计算设备集群执行第一方面中任一的音频增强方法。

29、第五方面,提供了一种通信装置,该装置包括:收发器、存储器和处理器。其中,收发器、存储器和处理器通过内部连接通路互相通信,存储器用于存储指令,处理器用于执行存储器存储的指令,以控制收发器收发信号,处理器包括获取模块和增强模块;当处理器执行存储器存储的指令时,使得处理器执行第一方面中任一的音频增强方法。

30、示例性地,处理器为一个或多个,存储器为一个或多个。

31、示例性地,存储器可以与处理器集成在一起,或者存储器与处理器分离设置。

32、在具体实现过程中,存储器可以为非瞬时性(non-transitory)存储器,例如只读存储器(read only memory,rom),其可以与处理器集成在同一块芯片上,也可以分别设置在不同的芯片上,本技术对存储器的类型以及存储器与处理器的设置方式不做限定。

33、第六方面,提供了一种包含指令的计算机程序产品,该指令由计算设备集群运行,计算设备集群包括获取模块和增强模块,当该指令被计算设备集群运行时,使得计算设备集群执行第一方面中任一的音频增强方法。

34、第七方面,提供了一种芯片,包括处理器,处理器包括获取模块和增强模块,处理器用于从存储器中调用并运行存储器中存储的指令,使得安装有该芯片的至少一个计算设备执行第一方面中任一的音频增强方法。示例性地,该芯片还包括:输入接口、输出接口和该存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连。

35、应当理解的是,本技术的第二方面至第七方面的技术方案及其对应的可能的实现方式所取得的有益效果可参见上述第一方面及其对应的可能的实现方式的技术效果,此处不再赘述。

本文地址:https://www.jishuxx.com/zhuanli/20240618/23903.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。