语音信号的处理方法、装置、设备及存储介质与流程
- 国知局
- 2024-06-21 10:39:50
本申请涉及语音处理技术,尤其涉及一种语音信号的处理方法、装置、设备及存储介质。
背景技术:
1、在课堂录播或直播中,通常需要采用拾音设备,对课堂上的语音进行录制,便于学生观看和学习。
2、现有技术中,对录制的语音信号进行3a(aec-ans-agc,回波抵消/背景噪声抑制/自动增益控制)处理。但是,3a算法会把常见的多人说话、音乐课上播放音乐等语音片段进行抑制,难以在多人同时说话的场景下清楚录制教师的声音,录制的音乐片段容易受损,无法听清,语音信号的处理精度较低。
技术实现思路
1、本申请提供一种语音信号的处理方法、装置、设备及存储介质,用以提高语音信号的处理精度。
2、第一方面,本申请提供一种语音信号的处理方法,包括:
3、获取待处理的语音波形信号,将所述待处理的语音波形信号转换为表示频域特征的语音数据;
4、根据所述语音数据,确定所述语音数据的语音类别;其中,所述语音类别表征语音数据的发出场景;
5、根据所述语音数据的语音类别,确定与所述语音数据的语音类别对应的降噪强度;
6、根据所述降噪强度,对所述待处理的语音波形信号进行降噪,得到降噪后的目标信号。
7、第二方面,本申请提供一种语音信号的处理装置,包括:
8、信号获取模块,用于获取待处理的语音波形信号,将所述待处理的语音波形信号转换为表示频域特征的语音数据;
9、类别确定模块,用于根据所述语音数据,确定所述语音数据的语音类别;其中,所述语音类别表征语音数据的发出场景;
10、强度确定模块,用于根据所述语音数据的语音类别,确定与所述语音数据的语音类别对应的降噪强度;
11、降噪模块,用于根据所述降噪强度,对所述待处理的语音波形信号进行降噪,得到降噪后的目标信号。
12、第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
13、所述存储器存储计算机执行指令;
14、所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的语音信号的处理方法。
15、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的语音信号的处理方法。
16、第五方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述的语音信号的处理方法。
17、本申请提供的一种语音信号的处理方法、装置、设备及存储介质,通过将时域特征的波形信号转换为频域特征,得到向量形式的语音数据。预设不同的语音类别,确定语音数据对应的语音类别,并确定语音类别对应的降噪强度。根据降噪强度,对语音数据对应的语音波形信号进行针对性处理。根据不同的降噪强度,实现在多种场景下进行语音信号的处理。解决了现有技术中,无法在多人说话的场景下进行精确降噪的问题,实现动态调整降噪策略,提高语音信号降噪处理的灵活性和精度。
技术特征:1.一种语音信号的处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述降噪强度,对所述待处理的语音波形信号进行降噪,得到降噪后的目标信号,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述频域信号,基于预设的复数域网络,得到第一中间结果,包括:
4.根据权利要求2所述的方法,其特征在于,所述复数域网络中包括10层卷积层为编码层,以及10层转置卷积层为解码层。
5.根据权利要求1所述的方法,其特征在于,根据所述语音数据,确定所述语音数据的语音类别,包括:
6.根据权利要求5所述的方法,其特征在于,所述语音数据为至少两个;
7.根据权利要求5所述的方法,其特征在于,根据所述语音数据属于预设的各语音类别的概率的大小,确定所述语音数据所属的语音类别,包括:
8.根据权利要求1所述的方法,其特征在于,根据所述语音数据的语音类别,确定与所述语音数据的语音类别对应的降噪强度,包括:
9.根据权利要求1-8中任一所述的方法,其特征在于,所述方法还包括:
10.根据权利要求1-8中任一所述的方法,其特征在于,所述方法还包括:
11.根据权利要求1-8中任一所述的方法,其特征在于,在得到降噪后的目标信号之后,还包括:
12.一种语音信号的处理装置,其特征在于,包括:
13.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-11中任一项所述的语音信号的处理方法。
15.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现如权利要求1-11中任一项所述的语音信号的处理方法。
技术总结本申请提供一种语音信号的处理方法、装置、设备及存储介质。该方法包括:获取待处理的语音波形信号,将所述待处理的语音波形信号转换为表示频域特征的语音数据;根据所述语音数据,确定所述语音数据的语音类别;其中,所述语音类别表征语音数据的发出场景;根据所述语音数据的语音类别,确定与所述语音数据的语音类别对应的降噪强度;根据所述降噪强度,对所述待处理的语音波形信号进行降噪,得到降噪后的目标信号。本申请的方法,通过确定语音类别,得到对应的降噪强度,从而根据不同的降噪强度对语音信号进行针对性的处理,提高语音信号处理的灵活性和精度。技术研发人员:李波受保护的技术使用者:广州视源电子科技股份有限公司技术研发日:技术公布日:2024/1/22本文地址:https://www.jishuxx.com/zhuanli/20240618/21051.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表