技术新讯 > 乐器声学设备的制造及制作,分析技术 > 显示设备、语音处理方法及装置与流程  >  正文

显示设备、语音处理方法及装置与流程

  • 国知局
  • 2024-06-21 10:38:50

本申请实施例涉及显示。更具体地讲,涉及一种显示设备、语音处理方法及装置。

背景技术:

1、随着多媒体显示技术的不断发展,通过将具备语音通话功能以及远程视频功能的显示大屏应用在远程会议中,使得不同地区的人员可以通过会议中展示的大屏进行实时沟通和讨论,扩展了远程会议的场景。

2、现有技术中,在远程会议的过程中,显示大屏会录入发言人的语音,并传输至远程会议终端。为了避免因发言人的位置距离显示大屏的麦克风太远而影响录入的语音的效果,显示大屏会对录入的语音进行提高增益以及去除混响处理,以提高远程会议过程中实时传输的语音质量。

3、然而,当因发言人的位置距离显示大屏的麦克风比较近时,对录入的声音进行去除混响处理后会导致在远程会议终端播放的声音出现干涩无力的问题,影响会议的通话效果。

技术实现思路

1、本申请示例性的实施方式提供一种显示设备、语音处理方法及装置,通过对目标场景的图像进行处理确定语音的来波方向以及对应的距离信息,根据距离信息对采集的语音的音频进行增益处理以及去混响处理,提升了通话质量。

2、第一方面,本申请实施例提供一种显示设备,包括:

3、图像获取装置,用于采集目标场景的待识别图像;

4、语音获取装置,用于采集目标人物的待处理语音;

5、控制器,被配置为:

6、获得待识别图像,对所述待识别图进行处理获得映射表,其中所述映射表中包含至少一组距离参数以及对应的角度参数;

7、获得待处理语音,对所述待处理语音进行波束成形算法处理,确定所述待处理语音对应的来波角度,若在所述映射表中存在所述来波角度对应的目标角度参数,则获得所述目标角度参数对应的目标距离;

8、确定所述目标距离对应的目标混响参数,并确定所述目标距离对应的目标增益参数,根据所述目标混响参数以及所述目标增益参数确定所述待处理语音对应的目标语音,并将所述目标语音发送至目标终端。

9、在一种可能的设计中,所述控制器被配置为,在执行所述确定所述目标距离对应的目标混响参数时,具体用于:

10、若所述目标距离小于预设最小距离,则确定所述目标混响参数为1;

11、若所述目标距离大于或者等于预设最小距离,则根据以下公式确定所述目标距离对应的目标混响参数:

12、τ=1+0.01log(10*d)

13、其中,τ为目标混响参数,d为目标距离。

14、在一种可能的设计中,所述控制器被配置为,在执行所述确定所述目标距离对应的目标增益参数时,具体用于:

15、根据以下公式确定所述目标距离对应的目标增益参数:

16、

17、其中,θ为目标增益参数,d为目标距离。

18、在一种可能的设计中,所述控制器被配置为,在执行所述根据所述目标混响参数以及所述目标增益参数确定所述待处理语音对应的目标语音时,具体用于:

19、根据所述目标混响参数以及目标增益参数的乘积确定目标系数;

20、根据所述目标系数以及所述待处理语音获得目标语音。

21、在一种可能的设计中,所述控制器被配置为,在执行所述对所述待识别图进行处理获得映射表时,具体用于:

22、对所述待识别图像进行人脸识别处理以及面部测距处理,获得至少一个人脸图像以及每个人脸图像对应的距离参数以及位置参数;

23、根据每个人脸图像对应的位置参数确定每个人脸图像对应角度参数;

24、根据所有人脸图像对应的距离参数以及角度参数生成映射表。

25、在一种可能的设计中,所述控制器被配置为,在执行所述根据每个人脸图像对应的位置参数确定每个人脸图像对应角度参数之后,还用于:

26、按照预设角度间隔参数获得至少一个角度区间,其中每个角度区间包含最小角度参数以及最大角度参数;

27、确定每个人脸图像对应的角度参数所匹配的角度区间,将属于相同角度区间的所有人脸图像对应的距离参数的均值作为角度区间对应的均值距离,并根据所有的角度区间以及对应的均值距离生成映射表。

28、在一种可能的设计中,所述控制器被配置为,在执行所述若在所述映射表中存在所述来波角度对应的目标角度参数,则获得所述目标角度参数对应的目标距离时,还用于:

29、若在所述映射表中确定存在所述目标角度参数符合的目标角度区间,则将所述目标角度区间对应的均值距离确定为所述目标角度参数对应的目标距离,其中所述目标角度参数大于或者等于所述目标角度区间对应的最小角度参数,且所述目标角度参数小于或者等于所述目标角度区间对应的最大角度参数。

30、在一种可能的设计中所述语音获取装置为包含了至少两个麦克风的麦克风阵列。

31、第二方面,本申请实施例提供一种语音处理方法,包括:

32、获得待识别图像,对所述待识别图进行处理获得映射表,其中所述映射表中包含至少一组距离参数以及对应的角度参数;

33、获得待处理语音,对所述待处理语音进行波束成形算法处理,确定所述待处理语音对应的来波角度,若在所述映射表中存在所述来波角度对应的目标角度参数,则获得所述目标角度参数对应的目标距离;

34、确定所述目标距离对应的目标混响参数,并确定所述目标距离对应的目标增益参数,根据所述目标混响参数以及所述目标增益参数确定所述待处理语音对应的目标语音,并将所述目标语音发送至目标终端。

35、第三方面,本申请实施例提供一种语音处理装置,包括:

36、获得模块,用于获得待识别图像,对所述待识别图进行处理获得映射表,其中所述映射表中包含至少一组距离参数以及对应的角度参数;

37、处理模块,用于获得待处理语音,对所述待处理语音进行波束成形算法处理,确定所述待处理语音对应的来波角度,若在所述映射表中存在所述来波角度对应的目标角度参数,则获得所述目标角度参数对应的目标距离;

38、确定模块,用于确定所述目标距离对应的目标混响参数,并确定所述目标距离对应的目标增益参数,根据所述目标混响参数以及所述目标增益参数确定所述待处理语音对应的目标语音,并将所述目标语音发送至目标终端。

39、本申请实施例提供的显示设备、语音处理方法及装置,通过获得摄像头拍摄的所有参与远程会议的人员的位置,确定所有位置的参与会议人员与麦克风之间的距离以及相对于摄像头的角度,当检测到有人员发言时,根据发言人的位置确定距离,并根据距离对发言人的语音进行智能增益以及去混响处理,提高远程会议的通话质量。

技术特征:

1.一种显示设备,其特征在于,包括:

2.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为,在执行所述确定所述目标距离对应的目标混响参数时,具体用于:

3.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为,在执行所述确定所述目标距离对应的目标增益参数时,具体用于:

4.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为,在执行所述根据所述目标混响参数以及所述目标增益参数确定所述待处理语音对应的目标语音时,具体用于:

5.根据权利要求1所述的显示设备,其特征在于,所述控制器被配置为,在执行所述对所述待识别图进行处理获得映射表时,具体用于:

6.根据权利要求5所述的显示设备,其特征在于,所述控制器被配置为,在执行所述根据每个人脸图像对应的位置参数确定每个人脸图像对应角度参数之后,还用于:

7.根据权利要求6所述的显示设备,其特征在于,所述控制器被配置为,在执行所述若在所述映射表中存在所述来波角度对应的目标角度参数,则获得所述目标角度参数对应的目标距离时,还用于:

8.根据权利要求1至7任一项所述的显示设备,其特征在于,所述语音获取装置为包含了至少两个麦克风的麦克风阵列。

9.一种语音处理方法,其特征在于,应用于显示装置的控制器,包括:

10.一种语音处理装置,其特征在于,包括:

技术总结本申请实施例提供一种显示设备、语音处理方法及装置,包括控制器、图像获取装置以及语音获取装置,控制器被配置为获得待识别图像,对待识别图进行处理获得映射表,对待处理语音进行波束成形算法处理,确定待处理语音对应的来波角度,若在映射表中存在来波角度对应的目标角度参数,则获得目标角度参数对应的目标距离;确定目标距离对应的目标混响参数和目标增益参数,根据目标混响参数以及目标增益参数确定待处理语音对应的目标语音,并将目标语音发送至目标终端,通过对目标场景的图像进行处理确定语音的来波方向以及对应的距离信息,根据距离信息对采集的语音的音频进行增益处理以及去混响处理,提升了通话质量。技术研发人员:伊子旭,胡永双,丁强受保护的技术使用者:青岛海信商用显示股份有限公司技术研发日:技术公布日:2024/1/15

本文地址:https://www.jishuxx.com/zhuanli/20240618/20909.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。