技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种对AI克隆声音进行识别的方法、装置及设备与流程 > 正文

一种对AI克隆声音进行识别的方法、装置及设备与流程

国知局
2024-06-21 11:53:46

本发明涉及数据处理，尤其涉及一种对ai克隆声音进行识别的方法、装置及设备。

背景技术：

1、近年中，科技飞速发展，而科技带来的弊端也逐渐浮现。在网络上观看短视频时都有遇到过一种现象，一段普通的视频出现不同角色的配音。这种ai声纹克隆技术以普遍运用到大众的生活娱乐中，同时也被不法分子盯上。

2、最近就有人运用ai声纹克隆技术实现破解银行的声音检测，操作目标银行账号。随着ai技术应用门槛不断下降，不法分子主要利用ai语音合成技术给受害者留下语音，或冒充其好友打电话给他们，以遭遇车祸，抢劫等接口诱骗受害者转账。

3、现有技术中若有不法分子使用ai克隆声音对用户进行实施诈骗时，用户无法对ai克隆声音进行识别，从而造成财产损失。

4、因此，现有技术还有待于改进和发展。

技术实现思路

1、鉴于上述现有技术的不足，本发明的目的在于提供一种对ai克隆声音进行识别的方法、装置及设备，旨在解决现有技术若有不法分子使用ai克隆声音对用户进行实施诈骗时，用户无法对ai克隆声音进行识别，从而造成财产损失的技术问题。

2、本发明的技术方案如下：

3、一种对ai克隆声音进行识别的方法，所述方法包括：

4、获取待识别的语音信息，对所述语音信息进行声纹提取，得到待检测的声纹特征；

5、将所述待检测的声纹特征与预先存储的原始声纹特征进行匹配，判断匹配是否成功；

6、若匹配成功，则判定待识别的语音信息不是ai克隆声音；

7、若匹配失败，则判定待识别的语音信息是ai克隆声音，并将判定结果发送至用户终端。

8、进一步地，所述获取待识别的语音信息，对所述语音信息进行声纹提取，得到待检测的声纹特征前，包括：

9、预先获取用户上传的随机语句对应的随机音频文件或特殊语句录音文件，对所述随机音频文件或是特殊语句录音文件进行声纹提取，得到用户的原始声纹特征；

10、存储所述原始声纹特征。

11、进一步优选地，所述对所述随机音频文件或是特殊语句录音文件进行声纹提取，得到用户的原始声纹特征，包括：

12、对所述随机音频文件或是特殊语句录音文件依次进行噪声消除、信号增强及特征提取操作后，得到用户的原始声纹特征。

13、进一步优选地，所述将所述待检测的声纹特征与预先存储的原始声纹特征进行匹配，判断匹配是否成功，包括：

14、计算所述待检测的声纹特征与预先存储的原始声纹特征的相似度，根据所述相似度判断匹配是否成功。

15、优选地，所述根据所述相似度判断匹配是否成功，包括:

16、若相似度大于等于预设的相似度阈值，则判定匹配成功；

17、若相似度小于预设的相似度阈值，则判定匹配失败。

18、进一步地，所述若匹配失败，则判定待识别的语音信息是ai克隆声音，并将判定结果发送至用户终端，包括：

19、若匹配失败，则判定待识别的语音信息是ai克隆声音，并将判定结果通过短信、通信或是微信方式中一种或多种发送至用户终端。

20、进一步地，所述获取待识别的语音信息，对所述语音信息进行声纹提取，得到待检测的声纹特征后，还包括:

21、对待识别的语音信息进行加密，得到加密后的语音信息；

22、对待检测的声纹特征进行加密，得到加密后的声纹特征。

23、本发明的另一实施例提供了一种对ai克隆声音进行识别的装置，装置包括：

24、声纹提取模块，用于获取待识别的语音信息，对所述语音信息进行声纹提取，得到待检测的声纹特征；

25、特征匹配模块，用于将所述待检测的声纹特征与预先存储的原始声纹特征进行匹配，判断匹配是否成功；

26、第一判定模块，用于若匹配成功，则判定待识别的语音信息不是ai克隆声音；

27、第二判定模块，用于若匹配失败，则判定待识别的语音信息是ai克隆声音，并将判定结果发送至用户终端。

28、本发明的另一实施例提供了一种对ai克隆声音进行识别的设备，所述设备包括至少一个处理器；以及，

29、与所述至少一个处理器通信连接的存储器；其中，

30、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的对ai克隆声音进行识别的方法。

31、本发明的另一实施例还提供了一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行时，可使得所述一个或多个处理器执行上述的对ai克隆声音进行识别的方法。

32、有益效果：本发明实施例可实现识别一段语音或者正在进行中的语音通话是否有涉及使用ai声纹克隆技术，当模型分析出的结果为涉嫌使用时，可将分析结果发送给用户，防止诈骗行为发生，规避被诈骗风险，防止不法分子采集个人用户声纹，进行伪造克隆，造成用户财产损失。

技术特征：

1.一种对ai克隆声音进行识别的方法,其特征在于,所述方法包括：

2.根据权利要求1所述的对ai克隆声音进行识别的方法，其特征在于，所述获取待识别的语音信息，对所述语音信息进行声纹提取，得到待检测的声纹特征前，包括：

3.根据权利要求2所述的对ai克隆声音进行识别的方法，其特征在于，所述对所述随机音频文件或是特殊语句录音文件进行声纹提取，得到用户的原始声纹特征，包括：

4.根据权利要求3所述的对ai克隆声音进行识别的方法，其特征在于，所述将所述待检测的声纹特征与预先存储的原始声纹特征进行匹配，判断匹配是否成功，包括：

5.根据权利要求4所述的对ai克隆声音进行识别的方法，其特征在于，所述根据所述相似度判断匹配是否成功，包括:

6.根据权利要求5所述的对ai克隆声音进行识别的方法，其特征在于，所述若匹配失败，则判定待识别的语音信息是ai克隆声音，并将判定结果发送至用户终端，包括：

7.根据权利要求6所述的对ai克隆声音进行识别的方法，其特征在于，所述获取待识别的语音信息，对所述语音信息进行声纹提取，得到待检测的声纹特征后，还包括:

8.一种对ai克隆声音进行识别的装置，其特征在于，所述装置包括：

9.一种对ai克隆声音进行识别的设备，其特征在于，所述设备包括至少一个处理器；以及，

10.一种非易失性计算机可读存储介质，其特征在于，所述非易失性计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行时，可使得所述一个或多个处理器执行权利要求1-7任一项所述的对ai克隆声音进行识别的方法。

技术总结本发明公开了一种对AI克隆声音进行识别的方法、装置及设备，该方法包括：获取待识别的语音信息，对所述语音信息进行声纹提取，得到待检测的声纹特征；将所述待检测的声纹特征与预先存储的原始声纹特征进行匹配，判断匹配是否成功；若匹配成功，则判定待识别的语音信息不是AI克隆声音；若匹配失败，则判定待识别的语音信息是AI克隆声音，并将判定结果发送至用户终端。本发明实施例可实现识别一段语音或者正在进行中的语音通话是否有涉及使用AI声纹克隆技术，当模型分析出的结果为涉嫌使用时，可将分析结果发送给用户，防止诈骗行为发生，规避被诈骗风险，防止不法分子采集个人用户声纹，进行伪造克隆，造成用户财产损失。技术研发人员：谢朝霞,朱斌,刘远洋受保护的技术使用者：深圳市安络科技有限公司技术研发日：技术公布日：2024/5/27