技术新讯 > 乐器声学设备的制造及制作,分析技术 > 基于LSTM模型的语音欺诈攻击检测方法、装置和电子设备与流程  >  正文

基于LSTM模型的语音欺诈攻击检测方法、装置和电子设备与流程

  • 国知局
  • 2024-06-21 11:27:01

本发明涉及语音检测,尤其是涉及一种基于lstm模型的语音欺诈攻击检测方法、装置和电子设备。

背景技术:

1、语音欺诈是指通过模仿、篡改特征等方法对语音特征进行修改,有可能达到非法通过自动说话人验证系统(automatic speaker verification,asv)验证的目的。为了asv系统的安全性,系统必须能够准确判断输入的语音特征的真伪,语音欺诈检测应运而生。

2、现有的语音欺诈检测算法有oc-resnet、cpcc-resnet、ist-gat、res2net等几种。通常误分类的样本带有更多影响分类结果的特征,在现有的语音欺诈检测算法中,并未考虑误分类的特征对模型学习的影响,导致现有语音欺诈检测算法的检测精度不高。

技术实现思路

1、本发明的目的在于提供一种基于lstm模型的语音欺诈攻击检测方法、装置和电子设备,以缓解现有语音欺诈检测算法的检测精度不高的技术问题。

2、第一方面,本发明实施例提供了一种基于lstm模型的语音欺诈攻击检测方法。包括:

3、将所述目标语音特征输入至lstm模型中,提取深层语音特征;

4、将所述lstm模型输出的所述深层语音特征作为注意力机制层的输入,提取关键语音特征;

5、将所述注意力机制层输出的所述关键语音特征输入至mv-softmax模型中进行训练判别,并输出判别结果;所述判别结果包括正类和负类;所述正类为正常语音,所述负类为被语音欺诈攻击的语音。

6、在一些可选的实现中,lstm模型包括遗忘门、输入门、状态门以及输出门;所述将所述目标语音特征输入至lstm模型中,提取深层语音特征,包括:

7、语音特征提取,得到输入xi∈cs×t×d;其中,s表示样本个数,t表示时间步长,d表示特征维度;

8、首先经过遗忘门对xt进行舍弃,得到ft,然后通过输入门得到待更新值it和新的候选值向量然后通过状态门更新状态ct,最后通过输出门更新ht,提取深层语音特征。

9、在一些可选的实现中,将所述lstm模型输出的所述深层语音特征作为注意力机制层的输入,提取关键语音特征,包括:

10、将lstm模型的输出作为输入,输入到注意力机制层,通过注意力机制层将查询向量和每个键向量进行点积计算得到权重,然后使用softmax函数对权重归一化处理,最后将权重和对应的值向量加权求和,提取关键语音特征。

11、在一些可选的实现中,还包括:

12、利用所述mv-softmax模型对错误分类的特征向量进行优化。

13、在一些可选的实现中,还包括:

14、交替更新所述lstm模型、所述注意力机制层和所述mv-softmax模型,直至正样本全被分类成正类,假样本全被分类成负类。

15、第二方面,提供了一种基于lstm模型的语音欺诈攻击检测装置,包括:

16、深层特征提取模块,用于将所述目标语音特征输入至lstm模型中,提取深层语音特征;

17、关键特征提取模块,用于将所述lstm模型输出的所述深层语音特征作为注意力机制层的输入,提取关键语音特征;

18、训练判别模块,用于将所述注意力机制层输出的所述关键语音特征输入至mv-softmax模型中进行训练判别,并输出判别结果;所述判别结果包括正类和负类;所述正类为正常语音,所述负类为被语音欺诈攻击的语音。

19、在一些可选的实现中,lstm模型包括遗忘门、输入门、状态门以及输出门;所述深层特征提取模块具体用于:

20、语音特征提取,得到输入xi∈cs×t×d;其中,s表示样本个数,t表示时间步长,d表示特征维度;

21、首先经过遗忘门对xt进行舍弃,得到ft,然后通过输入门得到待更新值it和新的候选值向量然后通过状态门更新状态ct,最后通过输出门更新ht,提取深层语音特征。

22、在一些可选的实现中,所述关键特征提取模块具体用于:

23、将lstm模型的输出作为输入,输入到注意力机制层,通过注意力机制层将查询向量和每个键向量进行点积计算得到权重,然后使用softmax函数对权重归一化处理,最后将权重和对应的值向量加权求和,提取关键语音特征。

24、在一些可选的实现中,还包括:

25、优化模块,用于利用所述mv-softmax模型对错误分类的特征向量进行优化。

26、在一些可选的实现中,还包括:

27、更新模块,用于交替更新所述lstm模型、所述注意力机制层和所述mv-softmax模型,直至正样本全被分类成正类,假样本全被分类成负类。

28、第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法的步骤。

29、第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述第一方面任一项所述的方法。

30、本发明提供了一种基于lstm模型的语音欺诈攻击检测方法、装置和电子设备。通过将所述目标语音特征输入至lstm模型中,提取深层语音特征;将所述lstm模型输出的所述深层语音特征作为注意力机制层的输入,提取关键语音特征;将所述注意力机制层输出的所述关键语音特征输入至mv-softmax模型中进行训练判别,并输出判别结果;所述判别结果包括正类和负类;所述正类为正常语音,所述负类为被语音欺诈攻击的语音。可以提升语音欺诈检测算法的检测精度。

技术特征:

1.一种基于lstm模型的语音欺诈攻击检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,lstm模型包括遗忘门、输入门、状态门以及输出门;所述将所述目标语音特征输入至lstm模型中,提取深层语音特征,包括:

3.根据权利要求1所述的方法,其特征在于,将所述lstm模型输出的所述深层语音特征作为注意力机制层的输入,提取关键语音特征,包括:

4.根据权利要求1所述的基于lstm模型的语音欺诈攻击检测方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的基于lstm模型的语音欺诈攻击检测方法,其特征在于,所述方法还包括:

6.一种基于lstm模型的语音欺诈攻击检测装置,其特征在于,包括:

7.根据权利要求6所述的装置,其特征在于,lstm模型包括遗忘门、输入门、状态门以及输出门;所述深层特征提取模块具体用于:

8.根据权利要求6所述的装置,其特征在于,所述关键特征提取模块具体用于:

9.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5任一项所述的方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至5任一项所述的方法。

技术总结本发明提供了一种基于LSTM模型的语音欺诈攻击检测方法、装置和电子设备,涉及语音检测的技术领域,包括:将所述目标语音特征输入至LSTM模型中,提取深层语音特征;将所述LSTM模型输出的所述深层语音特征作为注意力机制层的输入,提取关键语音特征;将所述注意力机制层输出的所述关键语音特征输入至MV‑Softmax模型中进行训练判别,并输出判别结果;所述判别结果包括正类和负类;所述正类为正常语音,所述负类为被语音欺诈攻击的语音,解决了现有语音欺诈检测算法的检测精度不高技术问题,达到了提高检测精度的技术效果。技术研发人员:陆韵,郑申俊,周龙,吕添,姚世凯,马清,王玉红受保护的技术使用者:杭州中奥科技有限公司技术研发日:技术公布日:2024/2/8

本文地址:https://www.jishuxx.com/zhuanli/20240618/21596.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。