技术新讯 > 电子通信装置的制造及其应用技术 > 大数据语音脱敏方法及装置与流程 > 正文

大数据语音脱敏方法及装置与流程

国知局
2024-08-02 14:55:19

本发明涉及大数据，也可用于金融领域，尤其涉及大数据语音脱敏方法及装置。

背景技术：

1、客服中心、远程银行以及各业务系统积累了海量的语音数据，能用于提炼知识信息，服务质检，挖掘潜在客户需求，具有广阔的应用前景。但是语音内容包含大量敏感的信息，例如银行电话客服和客户之间的对话内容，语音验证码等，往往包含用户的身份、账号、地址等敏感信息，如果直接存储使用，可能会被黑客攻击窃取，存在极大的隐私安全隐患。如果语音数据被未授权的人访问和利用，可能会对用户的信息安全和个人声誉造成重大影响。因此，为了更好地保护用户的隐私和信息安全，需要对语音数据进行脱敏处理，即去除语音数据中的敏感信息，如个人身份、电话号码、地址等。这就需要用到语音脱敏技术。

2、现有的语音脱敏方法主要有以下几种：(1)静态脱敏又指离线脱敏，在语音数据生成后，制定规则对语音数据进行替换或删除，如把电话号码替换成xxx，地址替换成省市区信息等，将数据中的敏感信息替换或删除后再存储。(2)动态脱敏，在语音数据生成后，对于实时产生的敏感信息进行过滤，如使用深度学习技术，识别和标注含有敏感信息的音频数据，进行过滤处理。(3)声音混淆，主要通过改变语音的音调、语速、音量等方式使得语音内容变得难以理解；或结合白噪声或钟摆噪声等方式进行混淆处理。(4)语音转文字后脱敏替换，通过将语音数据转文字后检测出敏感词，将敏感词进行脱敏替换，再将替换后的内容文本通过语音合成输出。上述方案均存在一定的缺陷，具体的：(1)静态脱敏由于是离线处理，实时性较差。难以应对新的、未知敏感信息。(2)动态脱敏对于一些复杂的敏感信息，深度学习技术和标注技术仍有一定的局限性，也会存在潜在的“误杀”问题，可能会误删正常信息。另外，实时处理需要占用大量的系统资源。(3)声音混淆转换后的语音很可能变得不清晰，在一些翻译等应用领域一定程度上造成影响；效果不如静态脱敏和动态脱敏；声音的处理需要匹配特定的模型，不能扩展到更多的复杂敏感信息。(4)语音转文字后脱敏替换过分依赖语音转文字的准确性，语音数据进行文字形式中转，更容易出现敏感信息泄露问题，也会存在过度消除语音的问题。

3、再者，现有的语音脱敏方法处理大规模语音数据往往需要占用大量的计算资源和时间，同时，通常是针对单机环境进行处理，完全依赖本地服务器的安全性。其次，传统语音脱敏技术应对不同业务的需求和变化，需要对脱敏算法、软件版本等进行不断调整和升级，物力成本较高；且存在单机环境的性能和拓展问题，无法拓展到更大的规模。

4、本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

技术实现思路

1、本发明实施例提供一种大数据语音脱敏方法，用以克服现有语音脱敏方法在，该方法包括：对待处理的原始语音数据进行拆分获得语音信号数据，通过快速傅里叶变换将所述语音信号数据转换为频域特征的语音幅度谱；提取所述语音幅度谱获得语音信号特征，通过利用卷积神经网络算法构建的预设语音分类模型分析所述语音信号特征获得语音分类掩码；根据所述语音分类掩码对所述语音幅度谱中预设敏感数据进行脱敏处理获得脱敏后的脱敏语音幅度谱；通过逆快速傅里叶变换处理所述脱敏语音幅度谱获得脱敏后的语音数据。

2、本发明实施例还提供一种大数据语音脱敏装置，用以，该装置包括：转换模块、分析模块、脱敏模块和生成模块；所述转换模块用于对待处理的原始语音数据进行拆分获得语音信号数据，通过快速傅里叶变换将所述语音信号数据转换为频域特征的语音幅度谱；所述分析模块用于提取所述语音幅度谱获得语音信号特征，通过利用卷积神经网络算法构建的预设语音分类模型分析所述语音信号特征获得语音分类掩码；所述脱敏模块用于根据所述语音分类掩码对所述语音幅度谱中预设敏感数据进行脱敏处理获得脱敏后的脱敏语音幅度谱；所述生成模块用于通过逆快速傅里叶变换处理所述脱敏语音幅度谱获得脱敏后的语音数据。

3、本发明实施例还提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述大数据语音脱敏方法。

4、本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述大数据语音脱敏方法。

5、本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现上述大数据语音脱敏方法。

6、本发明实施例提供的大数据语音脱敏方法及装置，可以去除语音信号中的敏感信息，从而避免用户的个人隐私、身份信息、电话号码等被泄露或利用；避免语音信号的传输和存储过程中被黑客攻击和窃取，从而提高信息的安全性。同时，语音数据的处理通常需要处理大量数据，可使用分布式系统基础架构平台可以实现分布式计算，能更高效完成大规模语音数据的脱敏处理，同时分布式系统基础架构平台可以通过增加节点来扩展计算性能和处理能力，支持快速响应和扩展业务需求，根据不同的业务需求，采用不同的算法、模型和处理方式对语音数据进行脱敏，有更高的灵活性。

技术特征：

1.一种大数据语音脱敏方法，其特征在于，所述方法包括：

2.根据权利要求1所述的大数据语音脱敏方法，其特征在于，对待处理的原始语音数据进行拆分获得语音信号数据包含：对待处理的原始语音数据进行滑窗分帧处理获得语音信号数据。

3.根据权利要求2所述的大数据语音脱敏方法，其特征在于，对待处理的原始语音数据进行滑窗分帧处理获得语音信号数据包含：

4.根据权利要求1所述的大数据语音脱敏方法，其特征在于，提取所述语音幅度谱获得语音信号特征包含：利用频率倒谱系数提取所述语音幅度谱获得语音信号特征。

5.根据权利要求4所述的大数据语音脱敏方法，其特征在于，利用频率倒谱系数提取所述语音幅度谱获得语音信号特征包含：

6.根据权利要求1所述的大数据语音脱敏方法，其特征在于，所述方法还包含：

7.根据权利要求1所述的大数据语音脱敏方法，其特征在于，根据所述语音分类掩码对所述语音幅度谱中预设敏感数据进行替换脱敏处理包含：

8.根据权利要求1至7中任一项所述的大数据语音脱敏方法，其特征在于，所述方法应用于分布式系统基础架构平台。

9.一种大数据语音脱敏装置，其特征在于，所述装置包括转换模块、分析模块、脱敏模块和生成模块；

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8任一所述方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。

12.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。

技术总结本发明公开了一种大数据语音脱敏方法及装置，涉及大数据技术领域，也可用于金融领域，其中该方法包括：对待处理的原始语音数据进行拆分获得语音信号数据，通过快速傅里叶变换将所述语音信号数据转换为频域特征的语音幅度谱；提取所述语音幅度谱获得语音信号特征，通过利用卷积神经网络算法构建的预设语音分类模型分析所述语音信号特征获得语音分类掩码；根据所述语音分类掩码对所述语音幅度谱中预设敏感数据进行脱敏处理获得脱敏后的脱敏语音幅度谱；通过逆快速傅里叶变换处理所述脱敏语音幅度谱获得脱敏后的语音数据。本发明可以避免用户的个人隐私、身份信息、电话号码等被泄露或利用。技术研发人员：陈嘉诚,官利玲,黄剑辉受保护的技术使用者：中国工商银行股份有限公司技术研发日：技术公布日：2024/7/29