语音处理方法、装置、电子设备及存储介质与流程
- 国知局
- 2024-09-14 14:56:29
本申请涉及声纹鉴定,更具体地,涉及一种语音处理方法、装置、电子设备及存储介质。
背景技术:
1、在声纹鉴定业务中,图谱分析是非常重要的手段。图谱分析的主要对象是音节,对汉语而言,一个音节就是一个汉字的完整发音,它包含声母和韵母。语音的图谱特征主要是指音节韵母部分的共振峰中心频率的分布、走势、强度以及带宽等信息。在相关技术中,一般是对图谱特征进行比对,来实现声纹鉴定,但是,仍存在声纹鉴定的准确性不高的问题。
技术实现思路
1、本申请提出了一种语音处理方法、装置、电子设备及存储介质,以改善上述缺陷。
2、第一方面,本申请实施例提供了一种语音处理方法,所述方法包括:获取待处理的目标语音;提取所述目标语音的声纹特征,作为目标声纹特征,所述目标声纹特征包括所述目标语音对应的目标图谱特征,以及所述目标语音中所有相邻音节之间的目标过渡特征;对所述目标声纹特征与样本声纹特征进行匹配,以基于匹配结果进行身份匹配识别,所述样本声纹特征包括样本语音对应的样本图谱特征,以及所述样本语音中所有相邻音节之间的样本过渡特征。
3、第二方面,本申请实施例提供了一种语音处理装置,所述装置包括:语音获取模块,用于获取待处理的目标语音;特征提取模块,用于提取所述目标语音的声纹特征,作为目标声纹特征,所述目标声纹特征包括所述目标语音对应的目标图谱特征,以及所述目标语音中所有相邻音节之间的目标过渡特征;声纹匹配模块,用于对所述目标声纹特征与样本声纹特征进行匹配,以基于匹配结果进行身份匹配识别,所述样本声纹特征包括样本语音对应的样本图谱特征,以及所述样本语音中所有相邻音节之间的样本过渡特征。
4、第三方面,本申请实施例还提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的方法。
5、第四方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述的方法。
6、本申请提供的方案中,获取待处理的目标语音;提取目标语音的声纹特征,作为目标声纹特征,目标声纹特征包括目标语音对应的目标图谱特征,以及目标语音中所有相邻音节之间的目标过渡特征;对目标声纹特征与样本声纹特征进行匹配,以基于匹配结果进行身份匹配识别,样本声纹特征包括样本语音对应的样本图谱特征,以及样本语音中所有相邻音节之间的样本过渡特征。也就是说,对目标语音的目标声纹特征和样本语音的样本声纹特征进行匹配,有效地实现语音的声纹身份验证;并且,目标声纹特征不仅包括图谱特征,还包括相邻音节之间的过渡特征,过渡特征能够更准确地反映个体语音的特性,从而进一步提高声纹身份验证的准确性和稳定性。
技术特征:1.一种语音处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述提取所述目标语音的声纹特征,作为目标声纹特征,包括:
3.根据权利要求2所述的方法,其特征在于,所述针对目标语音中任两个相邻音节,基于所述相邻音节中每个音节的发音时长以及每个音节的音节能量,获取时长过渡信息以及能量过渡信息,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于所述目标图谱特征以及所述目标过渡特征,确定所述目标声纹特征,包括:
5.根据权利要求1-4任一项所述的方法,其特征在于,所述对所述目标声纹特征与样本声纹特征进行匹配,以基于匹配结果进行身份匹配识别,包括:
6.根据权利要求5所述的方法,其特征在于,在所述获取所述目标过渡特征与所述样本过渡特征之间的相似度,得到第二相似度之前,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述样本声纹特征还包括多个预设平均过渡特征,所述多个预设平均过渡特征与多个第二预设音节组一一对应,每个第二预设音节组中包含的相邻音节的声调且拼音相同;
8.一种语音处理装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1至7任一项所述的方法。
技术总结本申请公开了一种语音处理方法、装置、电子设备及存储介质,涉及声纹鉴定技术领域。该方法包括:获取待处理的目标语音;提取目标语音的声纹特征,作为目标声纹特征,目标声纹特征包括目标语音对应的目标图谱特征,以及目标语音中所有相邻音节之间的目标过渡特征;对目标声纹特征与样本声纹特征进行匹配,以基于匹配结果进行身份匹配识别,样本声纹特征包括样本语音对应的样本图谱特征,以及样本语音中所有相邻音节之间的样本过渡特征。如此,由于目标声纹特征不仅包括图谱特征,还包括相邻音节之间的过渡特征,过渡特征能够更准确地反映个体语音的特性,从而进一步提高声纹身份验证的准确性和稳定性。技术研发人员:丁俊豪,张伟彬,陈东鹏受保护的技术使用者:深圳市声扬科技有限公司技术研发日:技术公布日:2024/9/12本文地址:https://www.jishuxx.com/zhuanli/20240914/296455.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表