基于神经网络的电力调度录音系统的语音降噪方法与流程
- 国知局
- 2024-06-21 11:39:11
本发明涉及电力系统,是一种基于神经网络的电力调度录音系统的语音降噪方法。
背景技术:
1、电力行业的调度录音系统主要作用是对电网调度命令进行记录,对电网故障处理过程进行记录,以及为电网事故分析提供语音的依据,因此每日需要对系统内的所有录音进行巡检。由于调度录音系统装置的周围环境必然会存在各种各样的噪音,导致巡检时所听到的录音十分嘈杂,对工作造成了一定困难。
2、考虑到在电力行业中,需要长期定时巡检调度录音系统中的录音,但由于调度录音系统的配置环境必不可少存在大量的环境噪音,这不但会导致巡检得到的结果存在误差,而且增大了巡检的难度。因此对调度录音系统中的语音进行降噪成为了必不可少的步骤。
技术实现思路
1、本发明提供了一种基于神经网络的电力调度录音系统的语音降噪方法,克服了上述现有技术之不足,其能有效解决调度录音系统因环境噪音导致巡检得到的结果存在误差的问题。
2、本发明的技术方案是通过以下措施来实现的:一种基于神经网络的电力调度录音系统的语音降噪方法,包括以下步骤:
3、步骤s1、进行语音预处理,提取调度录音系统中的录音文件,将语音文件转化成可输入神经网络的数据形式;其中,可输入神经网络的数据形式为rgb图片;
4、步骤s2、将带噪的录音转化为图片后作为数据输入神经网络,通过神经网络的图像修复技术将带噪后的语音图片恢复成原始语音图片;
5、步骤s3、将图像还原成语音文件。
6、下面是对上述发明技术方案的进一步优化或/和改进:
7、上述步骤s1具体可包括以下步骤:
8、s1.1、将输入的语音信号fft转化成rgb矩阵;
9、s1.2、将生成的rgb矩阵转化为图片并进行保存;
10、s1.3、利用批量处理函数将多条语音进行批量处理转化成图片。
11、在上述步骤s2中,可使用上下文编码器生成以周围环境为条件的任意图像区域的内容;其中,上下文编码器通过理解整个图像的内容,为缺失的部分产生一个合理的假设。
12、训练上述上下文编码器时,可进行一个标准的像素级重建损失,以及一个重建加上对抗性损失。
13、上述步骤s2具体可包括以下步骤:
14、s2.1、使用上下文编码器,根据输入的带噪图片预测恢复出降噪后的语音图片;
15、s2.2、进行语音图像修复。
16、可添加一个信道全连接层将编码器特征连接到解码器。
17、可通过回归到覆盖区域的真实内容来训练上下文编码器。
18、可通过有一个解耦的联合损失函数来处理上下文中的连续性和输出中的多个模式。
19、在训练过程中,可为每个图像和训练迭代自动生成二进制掩码。
20、上述上下文编码器的对抗性损失可为:
21、ladv=maxdex∈x[log(d(x))+log(1-d(f((1-m)⊙x)))]
22、其中,f和d使用交替sgd联合优化。
23、本发明提出了一种能够对调度录音系统中的语音进行降噪处理的新型方法,即基于神经网络的电力调度录音系统的语音降噪方法。本发明将带噪语音通过特定的函数编码成rgb图片,再利用计算机视觉方面的深度学习神经网络技术对生成的语音图片进行处理,产生滤除噪声的语音图片,最后将得到的去噪语音图片还原成语音,从而达到语音降噪的目的,实现对调度录音系统的降噪处理。本发明对于多种环境噪声具有较强的泛化能力,可以在降噪的同时保留原声音色,提高语音质量和可懂度,降低环境噪声对录音清晰度的影响,还可以同时滤除不同类型的噪声,可以滤除的噪声包含加性噪声和乘性噪声。该方法针对于录音系统的语音降噪处理不仅可以降低背景噪声干扰、改善语音质量、提升听者的舒适感、提高语音信息传达的可懂度,而且还可以在一定程度上减轻劳动力,提升录音的准确性,从而保障电力系统的安全运行。
技术特征:1.一种基于神经网络的电力调度录音系统的语音降噪方法,其特征在于包括以下步骤:
2.根据权利要求1所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于步骤s1具体包括以下步骤:
3.根据权利要求1所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于在步骤s2中,使用上下文编码器生成以周围环境为条件的任意图像区域的内容;其中,上下文编码器通过理解整个图像的内容,为缺失的部分产生一个合理的假设。
4.根据权利要求3所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于训练上下文编码器时,进行一个标准的像素级重建损失,以及一个重建加上对抗性损失。
5.根据权利要求1所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于步骤s2具体包括以下步骤:
6.根据权利要求3或4或5所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于添加一个信道全连接层将编码器特征连接到解码器。
7.根据权利要求3或4或5所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于通过回归到覆盖区域的真实内容来训练上下文编码器。
8.根据权利要求3或4或5所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于通过有一个解耦的联合损失函数来处理上下文中的连续性和输出中的多个模式。
9.根据权利要求3或4或5所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于在训练过程中,为每个图像和训练迭代自动生成二进制掩码。
10.根据权利要求3或4或5所述的基于神经网络的电力调度录音系统的语音降噪方法,其特征在于上下文编码器的对抗性损失为:
技术总结本发明涉及电力系统技术领域,是一种基于神经网络的电力调度录音系统的语音降噪方法,其将带噪语音通过特定的函数编码成RGB图片,再利用计算机视觉方面的深度学习神经网络技术对生成的语音图片进行处理,产生滤除噪声的语音图片,最后将得到的去噪语音图片还原成语音,从而达到语音降噪的目的,实现对调度录音系统的降噪处理。本发明针对于录音系统的语音降噪处理不仅可以降低背景噪声干扰、改善语音质量、提升听者的舒适感、提高语音信息传达的可懂度,而且还可以在一定程度上减轻劳动力,提升录音的准确性,从而保障电力系统的安全运行。技术研发人员:孟霖,张子恒,赵刚,姚永波,巴燕·塔斯恒,刘雅婷,马瑞楠,马国强,王晓波,童欣宇受保护的技术使用者:国网新疆电力有限公司信息通信公司技术研发日:技术公布日:2024/3/27本文地址:https://www.jishuxx.com/zhuanli/20240618/22685.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表