技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频处理方法及装置与流程  >  正文

音频处理方法及装置与流程

  • 国知局
  • 2024-06-21 10:40:33

本公开涉及数据处理,尤其涉及一种音频处理方法及装置。

背景技术:

1、随着人工智能(artificial intelligence,ai)技术的发展,虚拟数字人技术应用范围越来越广,例如在车辆中使用车载助手实现功能输出和情感化陪伴,在各机构、单位办事大厅的服务台中使用虚拟助手,提供必要的业务引导和解释。虚拟数字人主要包含卡通人物驱动、真实人像驱动两个表现形式,使用真实人像驱动时,在声音处理的细节中无法给用户带来更真实的体验。

技术实现思路

1、本公开提供了一种音频处理方法及装置,以至少解决现有技术中存在的以上技术问题。

2、根据本公开的第一方面,提供一种音频处理方法,包括:

3、响应于目标对象头部的当前位姿满足第一条件,则确认当前位姿对应的声纹特征;

4、基于所述当前位姿对应的声纹特征,对所述目标对象输出的音频进行调整;以使调整后输出的音频与目标对象头部的当前位姿相对应;

5、所述目标对象输出调整后的音频;

6、所述第一条件包括目标对象的头部位姿为左转头、右转头、抬头和低头之一。

7、根据本公开的第二方面,提供一种音频处理装置,包括:

8、获取单元,用于响应于目标对象头部的当前位姿满足第一条件,则确认当前位姿对应的声纹特征;

9、调整单元,用于基于所述当前位姿对应的声纹特征,对所述目标对象输出的音频进行调整;以使调整后输出的音频与目标对象头部的当前位姿相对应;

10、输出单元,用于输出经过调整后的音频;

11、所述第一条件包括目标对象的头部位姿为左转头、右转头、抬头和低头之一。

12、根据本公开的第三方面,提供了一种电子设备,包括:

13、至少一个处理器;以及

14、与所述至少一个处理器通信连接的存储器;其中,

15、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。

16、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种音频处理方法,所述方法包括:

2.根据权利要求1所述的方法,所述响应于目标对象头部的当前位姿满足第一条件之前,所述方法还包括:

3.根据权利要求2所述的方法1,所述基于目标对象的面部朝向、面部显示区域,以及面部显示区域中五官的相对位置中至少之一,确认所述目标对象头部的当前位姿,包括以下至少之一:

4.根据权利要求1所述的方法,所述响应于目标对象头部的当前位姿满足第一条件,则确认当前位姿对应的声纹特征之前,所述方法还包括:

5.根据权利要求1所述的方法,所述对所述目标对象输出的音频进行调整,包括以下之一:

6.根据权利要求1所述的方法,所述基于所述当前位姿对应的声纹特征,对所述目标对象输出的音频进行调整,包括:

7.根据权利要求5或6所述的方法,在基于所述当前位姿对应的声纹特征,对所述目标对象输出的音频进行调整之前,所述方法还包括:

8.根据权利要求7所述的方法,所述若目标对象输出的音频中不包括当前位姿对应的声纹特征,则基于当前位姿对应的声纹特征对所述目标对象输出的音频进行调整,包括:

9.根据权利要求1所述的方法,所述基于所述当前位姿对应的声纹特征,对所述目标对象输出的音频进行调整之后,所述方法还包括:

10.一种电子设备,其特征在于,包括:

技术总结本公开提供了一种音频处理方法及装置,所述方法包括:响应于目标对象头部的当前位姿满足第一条件,则确认当前位姿对应的声纹特征;基于所述当前位姿对应的声纹特征,对所述目标对象输出的音频进行调整;以使调整后输出的音频与目标对象头部的当前位姿相对应;所述目标对象输出调整后的音频;所述第一条件包括目标对象的头部位姿为左转头、右转头、抬头和低头之一。技术研发人员:彭方振,杨琳,马戈芳受保护的技术使用者:联想(北京)有限公司技术研发日:技术公布日:2024/1/22

本文地址:https://www.jishuxx.com/zhuanli/20240618/21113.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。