技术新讯 > 乐器声学设备的制造及制作,分析技术 > 用于在嘈杂环境中进行语音欺骗检测的方法和装置与流程  >  正文

用于在嘈杂环境中进行语音欺骗检测的方法和装置与流程

  • 国知局
  • 2024-06-21 11:40:58

本发明涉及语音欺骗检测。更具体地说,本发明涉及一种用于在嘈杂环境中进行语音欺骗检测的方法,从而增加保护和提高准确性。本发明还涉及一种用于在嘈杂环境中进行语音欺骗检测的装置,从而增加保护和提高准确性。

背景技术:

1、大多数电子设备都采用生物特征安全测量,即生物特征认证,以允许使用电子设备或在电子设备中执行任何操作。语音认证是生物特征认证之一,广泛应用于现代语音助手、语音控制系统,等等。语音认证用于将语音话语与生物特征配置文件进行匹配,以授予访问权限。许多访问服务的语音认证系统配备有语音认证/验证子系统(authentication/verification subsystem,avs),因此这些语音认证系统可能对每个人有限制。正如在alexa中所知,典型的语音验证系统与激活短语检测器耦合并使用唤醒短语对用户进行认证。例如,唤醒短语是与预录模板相匹配的语音模式。这些类型的语音认证系统可能容易受到欺骗攻击,例如,语音重放和语音合成。

2、目前,已有几种已知的语音反欺骗技术,包括检测录制/重放音频伪迹和检测语音背景连续性断裂。在语音认证系统中,现有的语音反欺骗技术高度依赖于噪声占主导地位的环境参数。汽车应用、工业应用和开放空间应用中的高噪声水平提供了边缘反欺骗引擎,攻击者可以利用噪声注入对语音认证系统发起连续攻击。此外,这些语音认证系统还包括几种互补技术,以建立可行的保护水平。现有的语音反欺骗系统存在噪声容忍度低的问题,这是关键问题之一。欺骗检测错误可能会随着高噪声水平而增加,导致语音认证系统的安全性和用户体验变得不可接受。

3、因此,本发明旨在提高现有系统或技术在语音欺骗检测方面的性能。

技术实现思路

1、本发明的一个目的是提供一种在嘈杂环境中进行语音欺骗检测的方法和装置,从而加强保护和提高准确性,同时避免现有技术方法的一个或多个缺点。

2、这个目的通过独立权利要求的特征来实现。其他实现方式在从属权利要求、说明书和附图中是显而易见的。

3、本发明提供了一种在嘈杂环境中进行语音欺骗检测的方法。本发明还提供了一种用于在嘈杂环境中进行语音欺骗检测的装置。

4、根据第一方面,提供了一种在嘈杂环境中进行语音欺骗检测的方法。所述方法包括:接收用户的语音输入。所述方法包括:接收与所述用户的所述语音输入对应的环境噪声测量值。所述方法包括:根据所述语音输入对所述用户进行认证。所述方法包括:根据所述环境噪声测量值确定噪声参数。所述方法包括:根据所述用户的所述语音输入,确定所述用户语音的伦巴第(lombard)效应相关特征的实际值。所述方法包括:通过将所述伦巴第效应相关特征的所述实际值与所述经过认证的用户的与所述确定的噪声参数对应的伦巴第效应相关特征模板进行比较,确定语音欺骗概率。

5、这种方法能更好地防止嘈杂环境中的语音欺骗攻击。上述方法能防止重放、模仿和语音合成攻击。上述方法可以包括额外的独立认证因素,以对用户进行认证,从而确保系统安全。上述方法相对轻量级。即使在非常嘈杂的环境中,上述方法也能通过语音欺骗概率提高用户的语音输入的准确性。上述方法引入了一种利用噪声进行语音欺骗检测的互补技术,大大提高了嘈杂环境中的语音反欺骗能力。

6、可选地,所述伦巴第效应相关特征包括所述用户语音在时域、频谱域和功率谱域上的特征在正常条件下和在所述嘈杂环境中的变化,包括语音基频、高中低频段之间的能量分布、声音强度、元音持续时间、频谱倾斜、格式中心频率、关键词持续时间和肺容量的变化。

7、可选地,所述噪声参数包括噪声类型和噪声水平。

8、可选地,所述伦巴第效应相关特征模板包括所述用户语音的所述伦巴第效应相关特征在不同噪声参数下的预设值。

9、可选地,所述伦巴第效应相关特征的所述预设值包括所述伦巴第效应相关特征的在训练周期内为所述用户语音在不同噪声参数下采集的平均值。

10、可选地,根据所述经过认证的用户的与所述确定的噪声参数对应的所述伦巴第效应相关特征模板,所述语音欺骗概率被确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的差值的函数。

11、可选地,所述伦巴第效应相关特征模板还包括所述伦巴第效应相关特征的权重,所述语音欺骗概率被确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的加权差值的函数,其中,所述加权差值通过所述权重得到。

12、可选地,所述方法还包括:根据所述语音欺骗概率验证所述用户的认证。

13、可选地,所述方法还包括:响应于所述验证所述用户的认证,使用所述伦巴第效应相关特征的所述实际值更新所述用户的所述伦巴第效应相关特征模板。

14、根据第二方面,提供了一种在嘈杂环境中进行语音欺骗检测的装置。所述装置包括:输入模块,用于接收用户的语音输入和与所述用户的所述语音输入对应的环境噪声测量值;语音验证模块,用于根据所述语音输入对所述用户进行认证;噪声检索器,用于根据所述环境噪声测量值确定噪声参数;伦巴第特征检索器,用于根据所述用户的所述语音输入确定伦巴第效应相关特征的实际值;欺骗检测器,用于通过将所述伦巴第效应相关特征的所述实际值与所述经过认证的用户的与所述确定的噪声参数对应的伦巴第效应相关特征模板进行比较,确定语音欺骗概率。

15、上述装置可以更好地防止嘈杂环境中的语音欺骗攻击。上述装置能防止重放、模仿和语音合成攻击。上述装置可以包括额外的独立认证因素,以对用户进行认证,从而确保系统安全。上述装置相对轻量级。即使在非常嘈杂的环境中,上述装置也能通过语音欺骗概率提高用户的语音输入的准确性。上述装置引入了一种利用噪声进行语音欺骗检测的互补技术,大大提高了嘈杂环境中的语音反欺骗能力。

16、可选地,所述伦巴第特征检索器用于通过估计所述用户语音在时域、频谱域和功率谱域上的特征在正常条件下和在嘈杂环境中的变化,确定所述伦巴第效应相关特征的所述实际值,其中,所述变化包括语音基频、高中低频段之间的能量分布、声音强度、元音持续时间、频谱倾斜、格式中心频率、关键词持续时间和肺容量的变化。

17、可选地,所述噪声检索器用于确定噪声类型和噪声水平。

18、可选地,所述伦巴第效应相关特征模板包括所述用户语音的所述伦巴第效应相关特征在不同噪声参数下的预设值。

19、可选地,所述伦巴第效应相关特征的所述预设值包括所述伦巴第效应相关特征的在训练周期内为所述用户语音在不同噪声参数下采集的平均值。

20、可选地,所述欺骗检测器用于根据所述经过认证的用户的与所述确定的噪声参数对应的所述伦巴第效应相关特征模板,将所述语音欺骗概率确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的差值的函数。

21、可选地,所述伦巴第效应相关特征模板还包括所述伦巴第效应相关特征的权重,所述欺骗检测器用于将所述语音欺骗概率确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的加权差值的函数,其中,所述加权差值通过所述权重得到。

22、可选地,所述装置还包括决策模块,所述决策模块用于根据所述语音欺骗概率验证所述用户的认证。

23、可选地,所述装置还包括数据采集器,所述数据采集器用于为每个用户采集所述用户语音在正常条件下的特征、噪声参数、所述用户语音的所述伦巴第效应相关特征在所述噪声参数下的实际值和所述伦巴第特征效应相关模板。

24、可选地,所述装置还包括学习引擎,所述学习引擎用于:响应于所述决策模块和/或学习触发器验证所述用户的认证,使用所述伦巴第效应相关特征的所述实际值更新所述用户的所述伦巴第效应相关特征模板。

25、因此,与现有技术相比,上述方法和装置能更好地防止嘈杂环境中的语音欺骗攻击。即使在非常嘈杂的环境中,上述方法和装置也可以通过语音欺骗概率提高用户的语音输入的准确性。

26、根据下文描述的一种或多种实现方式,本发明的这些和其他方面是显而易见的。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22872.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。