一种基于DCN的声纹识别方法与流程
- 国知局
- 2024-06-21 11:33:22
本发明涉及工程施工安全监控,特别指一种基于dcn的声纹识别方法。
背景技术:
1、工程施工过程中难免会存在一些安全隐患,为了尽量将安全隐患降低,需要在工程施工过程中进行安全监控。例如电缆施工过程中,电锤、电镐等施工机械会随着施工的过程发出时间序列不确定、强度不确定的一系列声纹,通过对这些声纹进行识别,可及时发现存在的安全隐患,进而进行安全预警。
2、为了对声纹进行识别需要借助wide&deep模型,wide&deep模型的deep侧是一个dnn(深度神经网络)模型,wide侧是一个lr线性模型,虽然dnn模型对于交叉特征的学习有着天然的优势,但lr线性模型无法有效的学习交叉特征,而工程施工过程中产生的声纹存在大量的交叉特征,导致传统wide&deep模型的特征表达能力欠佳,进而影响声纹识别准确性。
3、因此,如何提供一种基于dcn的声纹识别方法,实现提升声纹识别准确性,成为一个亟待解决的技术问题。
技术实现思路
1、本发明要解决的技术问题,在于提供一种基于dcn的声纹识别方法,实现提升声纹识别准确性。
2、本发明是这样实现的:一种基于dcn的声纹识别方法,包括如下步骤:
3、步骤s1、获取工程施工过程中大量的历史声纹数据,基于各所述历史声纹数据构建数据集,将所述数据集划分为训练集、验证集以及测试集;
4、步骤s2、基于dcn创建一声纹识别模型;
5、步骤s3、通过所述训练集对声纹识别模型进行训练,通过所述验证集对训练后的声纹识别模型进行验证;
6、步骤s4、通过所述测试集对验证后的声纹识别模型进行测试,并不断优化所述声纹识别模型的损失函数以及超参数;
7、步骤s5、通过声纹传感器阵列从工程施工场地采集施工机械发出的声纹模拟信号,将所述声纹模拟信号转换为声纹数字信号后输入测试后的声纹识别模型,以进行声纹识别。
8、进一步的,所述步骤s1中,所述将数据集划分为训练集、验证集以及测试集具体为:
9、对所述数据集进行清洗以及标注后,基于预设比例将所述数据集划分为训练集、验证集以及测试集。
10、进一步的,所述步骤s2中,所述声纹识别模型包括一输入层、一嵌入层、一堆叠层、一交叉网络层、一深度网络层以及一输出层;
11、所述嵌入层的输入端与输入层的输出端连接,输出端与堆叠层的输入端连接;所述堆叠层的输入端与输入层的输出端连接;所述交叉网络层的输入端与堆叠层的输出端连接,输出端与输出层的输入端连接;所述深度网络层的输入端与堆叠层的输出端连接,输出端与输出层的输入端连接。
12、进一步的,所述输入层用于从声纹数字信号中提取离散特征向量以及第一连续特征向量;所述离散特征向量基于one-hot编码对声纹数字信号进行离散化处理得到。
13、进一步的,所述嵌入层用于将输入层输入的离散特征向量转换为第二连续特征向量:
14、xembed,i=wembed,ixi;
15、其中,xembed,i表示嵌入层输出的第二连续特征向量;wembed,i表示用于连接输入层和嵌入层的连接矩阵,r表示实数,ne和nv均为正整数;xi表示第i个离散特征向量。
16、进一步的,所述堆叠层用于对输入层输出的第一连续特征向量以及嵌入层输出的各第二连续特征向量进行组合,得到组合特征向量:
17、
18、其中,x0表示组合特征向量;xembed,k表示第k个第二连续特征向量;表示xembed,k的转置;xdense表示第一连续特征向量;表示xdense的转置。
19、进一步的,所述交叉网络层用于从堆叠层输出的组合特征向量中提取交叉特征向量:
20、
21、其中,xl+1表示交叉网络层的第(l+1)层输出的交叉特征向量,xl+1∈rd,r表示实数,d表示交叉特征向量的特征维度;xl表示交叉网络层的第l层输出的交叉特征向量,xl∈rd;x0表示堆叠层输出的组合特征向量;表示xl的转置;wl和bl均表示交叉网络层的第l层的网络参数,且wl,bl∈rd。
22、进一步的,所述深度网络层用于从堆叠层输出的组合特征向量中提取深度特征向量:
23、hl+1=f(w'lhl+b'l);
24、其中,hl+1表示深度网络层的第(l+1)层输出的深度特征向量,r表示实数,nl+1表示深度特征向量的特征维度;hl表示深度网络层的第l层输出的深度特征向量,nl表示深度特征向量的特征维度;w'l和b'l均表示深度网络层的第l层的网络参数,f()表示激活函数。
25、进一步的,所述输出层用于对交叉网络层输出的交叉特征向量以及深度网络层输出的深度特征向量进行组合,得到声纹类别的预测概率并进行输出:
26、
27、其中,p表示声纹类别的预测概率;σ()表示激活函数;xl+1表示交叉特征向量;表示xl+1的转置;hl+1表示深度特征向量;表示hl+1的转置;wlogits表示权重。
28、进一步的,所述步骤s4中,所述超参数至少包括随机失活率、权值衰减率、学习率以及混合残差比例。
29、本发明的优点在于:
30、通过获取工程施工过程中大量的历史声纹数据构建数据集,将数据集划分为训练集、验证集以及测试集;通过训练集对基于dcn创建的声纹识别模型进行训练,通过验证集对训练后的声纹识别模型进行验证;通过测试集对验证后的声纹识别模型进行测试,并不断优化声纹识别模型的损失函数以及超参数,最后通过声纹传感器阵列从工程施工场地采集施工机械发出的声纹模拟信号,将声纹模拟信号转换为声纹数字信号后输入测试后的声纹识别模型,以进行声纹识别;由于声纹识别模型由输入层、嵌入层、堆叠层、交叉网络层、深度网络层以及输出层组成,输入层用于从声纹数字信号中提取离散特征向量以及第一连续特征向量,嵌入层用于将离散特征向量转换为第二连续特征向量,堆叠层用于对第一连续特征向量以及各第二连续特征向量进行组合得到组合特征向量,交叉网络层用于从组合特征向量中提取交叉特征向量,深度网络层用于从组合特征向量中提取深度特征向量,输出层用于对交叉特征向量以及深度特征向量进行组合,得到声纹类别的预测概率并进行输出;即声纹识别模型可有效学习交叉特征,具有很强的特征表达能力,进而极大的提升了声纹识别准确性。
技术特征:1.一种基于dcn的声纹识别方法,其特征在于:包括如下步骤:
2.如权利要求1所述的一种基于dcn的声纹识别方法,其特征在于:所述步骤s1中,所述将数据集划分为训练集、验证集以及测试集具体为:
3.如权利要求1所述的一种基于dcn的声纹识别方法,其特征在于:所述步骤s2中,所述声纹识别模型包括一输入层、一嵌入层、一堆叠层、一交叉网络层、一深度网络层以及一输出层;
4.如权利要求3所述的一种基于dcn的声纹识别方法,其特征在于:所述输入层用于从声纹数字信号中提取离散特征向量以及第一连续特征向量;所述离散特征向量基于one-hot编码对声纹数字信号进行离散化处理得到。
5.如权利要求3所述的一种基于dcn的声纹识别方法,其特征在于:所述嵌入层用于将输入层输入的离散特征向量转换为第二连续特征向量:
6.如权利要求3所述的一种基于dcn的声纹识别方法,其特征在于:所述堆叠层用于对输入层输出的第一连续特征向量以及嵌入层输出的各第二连续特征向量进行组合,得到组合特征向量:
7.如权利要求3所述的一种基于dcn的声纹识别方法,其特征在于:所述交叉网络层用于从堆叠层输出的组合特征向量中提取交叉特征向量:
8.如权利要求3所述的一种基于dcn的声纹识别方法,其特征在于:所述深度网络层用于从堆叠层输出的组合特征向量中提取深度特征向量:
9.如权利要求3所述的一种基于dcn的声纹识别方法,其特征在于:所述输出层用于对交叉网络层输出的交叉特征向量以及深度网络层输出的深度特征向量进行组合,得到声纹类别的预测概率并进行输出:
10.如权利要求1所述的一种基于dcn的声纹识别方法,其特征在于:所述步骤s4中,所述超参数至少包括随机失活率、权值衰减率、学习率以及混合残差比例。
技术总结本发明提供了工程施工安全监控技术领域的一种基于DCN的声纹识别方法,包括:步骤S1、获取工程施工过程中大量的历史声纹数据,基于各历史声纹数据构建数据集,将数据集划分为训练集、验证集以及测试集;步骤S2、基于DCN创建一声纹识别模型;步骤S3、通过训练集对声纹识别模型进行训练,通过验证集对训练后的声纹识别模型进行验证;步骤S4、通过测试集对验证后的声纹识别模型进行测试,并不断优化声纹识别模型的损失函数以及超参数;步骤S5、通过声纹传感器阵列从工程施工场地采集施工机械发出的声纹模拟信号,将声纹模拟信号转换为声纹数字信号后输入测试后的声纹识别模型,以进行声纹识别。本发明的优点在于:极大的提升了声纹识别准确性。技术研发人员:章立宗,秦建松,汪磊,徐文华,金钢,顾煜明,王洪海,胡建平,潘劲飞,车艳红,张硕彬,张怀勋,朱建国,周洋,董钦,沈旭东,贺明受保护的技术使用者:绍兴大明电力建设有限公司技术研发日:技术公布日:2024/3/11本文地址:https://www.jishuxx.com/zhuanli/20240618/22213.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。