技术新讯 > 乐器声学设备的制造及制作,分析技术 > 声纹识别方法、装置、计算机设备和存储介质与流程 > 正文

声纹识别方法、装置、计算机设备和存储介质与流程

国知局
2024-06-21 11:45:50

本技术涉及生物特征识别，特别是涉及一种声纹识别方法、装置、计算机设备和存储介质。

背景技术：

1、在如今互联网大数据时代的背景下，可疑分子能够轻易地通过网络不正当交易获取用户的个人信息，同时电信公司内部员工泄露用户信息的情况也偶有发生，导致电信不当行为屡禁不止。

2、传统的防范方法是采用陌生号码标记，建立号码数据库技术。其基本思想是分析主叫号码的前缀、码长和标准化，输出可疑号码并配置到风险名单数据库中拦截诈骗电话，最终实现对电信用户的有效防欺诈。这种方法无法有效识别可疑分子利用伪基站或改号技术创建的虚假号码问题。

3、然而，目前通过建立号码数据库进行电信不当行为识别的方法中，由于可疑分子可以通过伪基站或者注册相近号码等手段成功绕过号码数据库，因此，存在人员识别不准确的问题。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高人员识别准确率的声纹识别方法、装置、计算机设备和存储介质。

2、第一方面，本技术提供了一种声纹识别方法，所述方法包括：

3、获取待识别语音数据，并提取所述待识别语音数据的待识别声纹特征；

4、基于声纹特征库，获取分布式集群中各节点的声纹特征数据；

5、将所述待识别声纹特征和所述各节点的声纹特征数据输入声纹识别模型，得到所述待识别声纹特征和所述各节点的声纹特征数据的相似度；

6、根据所述相似度，确定所述待识别语音数据的识别结果。

7、在其中一个实施例中，所述基于声纹特征库，获取分布式集群中各节点的声纹特征数据之前，所述方法还包括：

8、获取全量语音文件；

9、对所述全量语音文件进行分片，得到分片语音文件，并将所述分片语音文件分发至所述分布式集群中的各节点；

10、各节点分别对各所述分片语音文件进行声纹特征提取，得到各所述分片语音文件对应的声纹特征数据；

11、将各所述节点中的声纹特征数据确定为声纹特征库。

12、在其中一个实施例中，所述各节点分别对各所述分片语音文件中进行声纹特征提取，得到各所述分片语音文件对应的声纹特征数据包括：

13、各节点分别对各所述分片语音文件中的语音数据进行分帧加窗处理；

14、各节点根据声纹特征类型，从所述分帧加窗处理后的语音数据中提取各类型的声纹特征，将各类型的所述声纹特征作为对应分片语音文件的声纹特征数据；其中，声纹特征类型包括声学特征、词法特征以及韵律特征。

15、在其中一个实施例中，所述提取所述待识别语音数据的待识别声纹特征包括：

16、将所述待识别语音数据输入声纹特征提取模型，得到所述待识别语音数据对应的待识别声纹特征；其中，所述声纹特征提取模型为预先训练好的深度置信网络模型。

17、在其中一个实施例中，所述将所述待识别声纹特征和所述各节点的声纹特征数据输入声纹识别模型，得到所述待识别声纹特征和所述各节点的声纹特征数据的相似度，包括：

18、基于所述声纹识别模型，对所述待识别声纹特征和所述声纹特征数据中的各声纹特征进行声纹距离计算；

19、根据所述声纹距离计算的结果，确定所述待识别声纹特征与所述声纹特征数据中各声纹特征的相似度。

20、在其中一个实施例中，所述基于所述声纹识别模型，对所述待识别声纹特征和所述声纹特征数据中的各声纹特征进行声纹距离计算包括：

21、根据所述待识别声纹特征中每一时刻的离散余弦变换参数，确定所述待识别声纹特征的声纹特征矩阵；

22、根据所述声纹特征数据中各声纹特征每一时刻的离散余弦变换参数，确定所述声纹特征库中各声纹特征的声纹特征矩阵；

23、基于所述声纹识别模型，确定所述待识别声纹特征的声纹特征矩阵和所述各声纹特征的声纹特征矩阵的声纹距离。

24、在其中一个实施例中，所述根据所述相似度，确定所述待识别语音数据的识别结果，包括：

25、根据所述相似度，确定所述各声纹特征与待识别声纹特征的相似度是否大于预设阈值；

26、若存在与待识别声纹特征相似度大于预设阈值的声纹特征，则根据所述声纹特征对应的人员信息，确定所述待识别声纹特征的人员信息。

27、第二方面，本技术还提供了一种声纹识别装置。所述装置包括：

28、第一获取模块，用于获取待识别语音数据，并提取所述待识别语音数据的待识别声纹特征；

29、第二获取模块，用于基于声纹特征库，获取分布式集群中各节点的声纹特征数据；

30、相似度确定模块，用于将所述待识别声纹特征和所述各节点的声纹特征数据输入声纹识别模型，得到所述待识别声纹特征和所述各节点的声纹特征数据的相似度；

31、识别结果确定模块，用于根据所述相似度，确定所述待识别语音数据的识别结果。

32、第三方面，本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

33、获取待识别语音数据，并提取所述待识别语音数据的待识别声纹特征；

34、基于声纹特征库，获取分布式集群中各节点的声纹特征数据；

35、将所述待识别声纹特征和所述各节点的声纹特征数据输入声纹识别模型，得到所述待识别声纹特征和所述各节点的声纹特征数据的相似度；

36、根据所述相似度，确定所述待识别语音数据的识别结果。

37、第四方面，本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

38、获取待识别语音数据，并提取所述待识别语音数据的待识别声纹特征；

39、基于声纹特征库，获取分布式集群中各节点的声纹特征数据；

40、将所述待识别声纹特征和所述各节点的声纹特征数据输入声纹识别模型，得到所述待识别声纹特征和所述各节点的声纹特征数据的相似度；

41、根据所述相似度，确定所述待识别语音数据的识别结果。

42、第五方面，本技术还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

43、获取待识别语音数据，并提取所述待识别语音数据的待识别声纹特征；

44、基于声纹特征库，获取分布式集群中各节点的声纹特征数据；

45、将所述待识别声纹特征和所述各节点的声纹特征数据输入声纹识别模型，得到所述待识别声纹特征和所述各节点的声纹特征数据的相似度；

46、根据所述相似度，确定所述待识别语音数据的识别结果。

47、上述声纹识别方法、装置、计算机设备和存储介质，首先获取待识别语音数据，并提取待识别语音数据的待识别声纹特征；然后基于声纹特征库，获取分布式集群中各节点的声纹特征数据；之后将待识别声纹特征和各节点的声纹特征数据输入声纹识别模型，得到待识别声纹特征和各节点的声纹特征数据的相似度；最后根据相似度，确定待识别语音数据的识别结果。采用本技术的声纹识别方法，能够通过识别人员的待识别语音数据，有效地提高人员识别的准确率。