技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于声纹的外力破坏风险识别方法与流程  >  正文

一种基于声纹的外力破坏风险识别方法与流程

  • 国知局
  • 2024-06-21 11:58:18

本发明属于变压器的外力破坏风险检测,具体涉及一种基于声纹的外力破坏风险识别方法。

背景技术:

1、在当前的城乡建设和电力设施管理中,变压器遭受外力破坏不仅会导致电力供应中断,增加维修成本,还可能引发更严重的安全事故,对社会和经济造成影响。因此,提高变压器的防护能力,及时识别和预警外力破坏的风险成为了一个亟待解决的技术难题。

2、现有技术中,变压器的外力破坏风险的监控主要依赖于物理障碍、监控摄像头和巡检人员等手段。然而,这些方法各有局限。例如,物理障碍无法完全阻止有意图的破坏行为;监控摄像头受限于视野和光线条件,可能存在盲区,且在海量视频数据中及时准确地识别破坏行为具有挑战性;人工巡检则存在成本高、效率低、覆盖面有限等问题。此外,随着城市化进程的加速,电力设施周围的施工活动增多,传统监控方法在区分正常施工与潜在破坏活动方面的能力也受到挑战。

3、现有技术存在以下不足:

4、1、现有技术的监测方法依赖于视觉监控系统(如摄像头)或简单的传感器网络,这些方法无法有效识别所有类型的外力破坏活动,尤其是在视线不佳或环境噪声大的情况下。

5、2、现有技术的未能充分利用收集到的数据,缺乏有效的数据扩充方法,导致模型训练样本有限,影响模型的泛化能力和准确性。

6、3、现有技术缺乏有效的特征提取技术,难以从复杂的声音数据中提取出有用的信息,限制了风险识别的准确性。

7、4、由于训练数据的局限性和特征提取的不足,现有技术生成的模型面临泛化能力差的问题,导致在实际应用中遇到未见样本时性能下降。

8、5、缺乏高效的算法优化,使得现有技术在处理大规模数据和进行实时风险识别时效率不高,难以满足紧急情况下的快速响应需求。

技术实现思路

1、针对现有技术中的变压器的外力破坏风险检测中存在的诸多不足的技术问题,提供了一种基于声纹的外力破坏风险识别方法。

2、一种基于声纹的外力破坏风险识别方法,包括以下步骤:

3、步骤s1:采集变压器的外力破坏的声纹数据,对采集的外力破坏的声纹数据的风险类型进行标记;

4、步骤s2:训练基于最优架构搜索的对抗生成网络模型,训练后的基于最优架构搜索的对抗生成网络模型对步骤s1中采集的声纹数据进行扩充,输出扩充声纹数据;

5、在训练基于最优架构搜索的对抗生成网络模型的过程中,采用最优架构搜索策略,定义搜索空间s,搜索空间s包含若干不同配置的对抗生成网络模型,搜索的目标是找到最优配置使得对抗生成网络模型的评价函数的值最大化,其中,,和均为对抗生成网络模型的参数;

6、步骤s3:训练基于多粒度蜜罐优化算法的神经网络模型,训练后的基于多粒度蜜罐优化算法的神经网络模型提取步骤s2中的扩充声纹数据的原始特征表示,输出原始特征表示;

7、步骤s4:训练基于潜在狄利克雷分配的自编码器,训练后的基于潜在狄利克雷分配的自编码器对步骤s3中的原始特征表示进行降维重构,输出重构特征表示;

8、步骤s5:根据步骤s1中标记的风险类型训练基于差异性分支随机森林的分类器,训练后的基于差异性分支随机森林的分类器对步骤s4中的重构特征表示进行分类,通过分类确定外力破坏的风险类型。

9、进一步的,步骤s1包括:

10、步骤s11:采集变压器的外力破坏的声纹数据,采集的声纹数据格式为数字音频格式,外力破坏的声纹数据包括施工机械的工作噪声;

11、步骤s12:对步骤s1中采集到的声纹数据的风险类型进行标记,风险类型包括低分险、中风险、高风险和无风险。

12、进一步的,步骤s2中的训练基于最优架构搜索的对抗生成网络模型,具体为:

13、步骤s21:初始化对抗生成网络模型的生成器g和判别器d的参数,设生成器g的参数为,判别器d的参数为,生成器g通过学习映射函数将输入的噪声向量z映射到数据空间从而生成模拟的声纹数据,判别器d通过函数评估生成的模拟声纹数据的真伪;

14、步骤s22:采用最优架构搜索策略,定义搜索空间s,搜索空间s包含若干不同配置的对抗生成网络模型,搜索的目标是找到最优配置使得对抗生成网络模型的评价函数的值最大化,其中,;

15、步骤s23:在步骤s22搜索出的对抗生成网络模型中,通过动态调整损失函数,平衡生成器g和判别器d的能力,定义生成器损失函数,判别器损失函数,通过迭代更新损失函数来调整训练策略的方式表示为:

16、;

17、;

18、其中,表示期望,表示判别器d对生成器g的生成的模拟声纹数据的判断,表示服从的概率分布,表示判别器函数,表示生成器函数,表示z服从的概率分布;

19、判别器d对生成器g的生成的模拟声纹数据的判断,表示为:

20、;

21、判别器d损失函数中的对数项表示判别器d判断生成的模拟声纹数据不属于真实数据集的概率,其计算方式表示为:

22、;

23、步骤s24:定义生成的模拟声纹数据的评估函数为e(g),评估函数e(g)衡量生成的模拟声纹数据与采集的声纹数据的相似度;

24、步骤s25:根据步骤s24生成的模拟声纹数据的评估结果,调整步骤s22中最优架构搜索策略和步骤s23中生成器损失函数和判别器损失函数的参数,并调整生成器g和判别器d的参数,设为反馈机制函数,根据评估函数e(g)的结果动态调整参数,更新规则表示为:

25、;

26、;

27、其中,为更新后的生成器g的参数,为更新后的判别器d的参数,表示反馈机制函数;

28、评估函数e(g)采用fid指标计算,用于衡量生成的模拟声纹数据与采集的声纹数据的相似度,设为生成的模拟声纹数据的特征分布,为采集的声纹数据的特征分布,fid基于这两个分布的均值和协方差,计算公式表示为:

29、;

30、其中,和分别是生成的模拟声纹数据和采集的声纹数据的特征的均值向量,和分别是和对应的协方差矩阵,tr表示矩阵的迹;

31、步骤s26:经过迭代优化后,通过优化参数确定生成对抗网络模型,并利用生成器g进行生成扩充声纹数据。

32、进一步的,步骤s3中的训练基于多粒度蜜罐优化算法的神经网络模型,具体为:

33、步骤s31:初始化基于多粒度蜜罐优化算法的神经网络模型的参数,参数包括若干个粒度层次,每个粒度层次对应不同的特征提取子网络;

34、步骤s32:对每个粒度层次对应的特征提取子网络分别进行训练,使用扩充声纹数据进行前向传播和反向传播,按照预设的训练周期更新特征提取子网络的网络参数,每个粒度层次的特征提取子网络都独立优化,以提取对应粒度层次下的声纹特征,对于每个粒度层次,特征提取过程表示为:

35、;

36、其中,表示粒度层次的位置,为第粒度层次提取的声纹特征,和分别为第粒度层次的对应的特征提取子网络的权重和偏置,表示sigmoid激活函数,表示卷积操作;

37、激活函数的计算方式表示为:

38、;

39、其中,xs表示激活函数的输入,即的结果;

40、步骤s33:使用蜜罐优化算法对不同粒度层次的对应的特征提取子网络提取的声纹特征进行选择和组合,模拟自然选择过程,评估不同声纹特征组合的性能,保留表现最优的声纹特征组合作为原始特征表示,蜜罐优化算法选择和组合不同粒度层次的特征的优化过程形式化为:

41、;

42、其中,表示总损失函数,表示第粒度层次的声纹特征的损失函数,和分别表示第粒度层次的声纹特征的多样性度量函数和独特性度量函数,,,是超参数;

43、多样性度量函数通过计算提取的声纹特征之间的余弦相似度的平均值来实现,表示为:

44、;

45、其中,n表示提取的声纹特征的总数,表示两个提取的声纹特征的点积,和分别表示提取的声纹特征的模;

46、独特性度量函数通过计算特征向量与所有特征向量平均值的欧几里得距离来实现,表示为:

47、;

48、其中,n表示提取的声纹特征的总数,表示所有提取的声纹特征的平均值;

49、步骤s34:对于总损失函数,使用非线性共轭梯度法进行优化,更新权重和偏置的过程表示为:

50、;

51、;

52、其中,和分别表示关于和的梯度,是第一学习率;

53、第k步迭代时,权重更新方向的计算方式表示为:

54、;

55、其中,是上一次迭代的更新方向,表示第二学习率,是根据fletcher-reeves公式计算的,表示为:

56、;

57、其中,表示第k次迭代时总损失函数关于的梯度。

58、进一步的,步骤s4中的训练基于潜在狄利克雷分配的自编码器,具体为:

59、步骤s41:初始化自编码器的编码器和解码器参数,同时初始化潜在狄利克雷分配的参数;

60、步骤s42:输入原始特征表示并通过编码器进行特征压缩,获得低维表示,并根据潜在狄利克雷分配生成潜在主题分布,编码器的编码过程表示为:

61、;

62、其中,为编码器处理后的低维特征表示,表示编码器的参数,表示sigmoid激活函数,表示编码器的偏置项;

63、步骤s43:基于潜在主题分布进行隐变量抽样,隐变量代表了声纹数据生成过程中的潜在因素,隐变量抽样表示为:

64、;

65、其中,表示狄利克雷分布,是将编码后的特征转换为狄利克雷分布参数的函数,z表示从狄利克雷分布中抽样得到的隐变量;

66、步骤s44:隐变量通过解码器重构特征,通过最小化重构误差和潜在主题分布的kl散度来优化自编码器的参数,确保重构特征表示接近原始特征表示,同时保证隐变量的分布接近先验分布,解码器重构的过程表示为:

67、;

68、其中,为解码器重构的声纹数据特征,表示解码器的参数,表示解码器的偏置项;

69、在训练过程中,损失函数的计算方式表示为:

70、;

71、;

72、其中,表示重构的特征与输入特征的误差损失,表示原始特征表示,表示kl散度损失,是给定输入数据后隐变量的后验分布,p(z)是隐变量的先验分布,表示kl散度计算;

73、自编码器总损失表示为:

74、;

75、其中,l表示自编码器总损失,、表示超参数;

76、参数更新使用梯度下降法,以最小化总损失,更新的方式表示为:

77、;

78、;

79、;

80、其中,其中,、和表示更新后的参数,表示第三学习率,、和分别表示关于、和的更新梯度。

81、进一步的,步骤s5中的训练基于随机森林的分类器,具体为:

82、步骤s51:初始化随机森林的参数,参数包括随机森林的树的数量、树的最大深度,设重构特征表示的数据集为,其中表示重构特征表示,是对应的标签,是重构特征表示的总数,随机森林中树的总数设为t;

83、步骤s52:对于森林中的每棵树t,在每个节点进行分裂时,引入基于差异性分支的算法,选择最能增加树之间差异性的特征和分裂点;

84、对于森林中的每一棵树t,从重构特征表示的数据集d中随机采样若干个重构特征表示,构成子集,每个决策节点在分裂时随机选择m个特征,其中m≤m,其中,m表示特征的总数;

85、接着进行差异性分支操作,在每个节点分裂时,选择最优特征和最优分裂点以最大化差异性增益δg,表示为:

86、;

87、其中,表示最优特征和最优分裂点的集合,表示特征,表示分裂点;

88、差异性增益δg定义为:

89、(25);

90、其中,g是基于gini不纯度计算的分裂增益,表示子集的分裂增益,和分别是按照特征和分裂点分裂后的左子集和右子集;

91、分裂增益g基于gini不纯度来计算,对于给定的数据集d,gini不纯度定义为:

92、;

93、其中,表示数据集d中属于类k的样本的比例,k表示类的总数;

94、步骤s53:在树的构建过程中,应用稀疏性改进机制,通过一个优化过程确定是否忽略某些特征,在每次分裂决策中,引入稀疏性参数来控制特征的选择,选择一个特征集合,最小化包含稀疏性正则化项的目标函数,表示为:

95、;

96、其中,表示基于选择的特征集合f的损失函数,表示f的范数,特征集合中元素的数量表示被选特征的数量,表示稀疏性参数;

97、损失函数基于均方误差计算,定义为:

98、;

99、其中,是基于选择的特征集合f的分类器对重构特征表示的特征向量的预测值,是实际的标签值;

100、步骤s54:使用交叉验证法评估基于差异性随机森林的分类器的性能,根据评估结果调整分类器参数。

101、本发明的有益效果在于:

102、1)将声纹识别技术应用于电力设施的外力破坏风险识别中,通过分析施工机械的声音数据,能够有效地识别出对变压器构成威胁的活动。

103、2)采用基于最优架构搜索的生成对抗网络算法进行数据扩充,能自动寻找最适合声纹数据特性的生成对抗网络架构,优化生成模型的性能,提高了声纹特征的学习和复现能力。

104、3)在特征提取模型训练中,采用基于多粒度蜜罐优化算法的神经网络算法,能够在不同的粒度层次上捕捉声纹数据的特征,增强了特征的表现力和区分度。

105、4)在特征降维中,采用基于潜在狄利克雷分配的自编码器结构,使得编码过程能够考虑到数据的潜在主题分布,提高了模型对数据生成过程的理解能力。

106、5)提出一种改进的随机森林分类算法,通过增加树之间的差异性和应用稀疏性改进机制,不仅提高了分类准确率,还降低了模型复杂度。

本文地址:https://www.jishuxx.com/zhuanli/20240618/24799.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。