一种应急广播语音活性检测方法、系统、设备及介质与流程
- 国知局
- 2024-06-21 10:41:27
本发明涉及应急广播,特别指一种应急广播语音活性检测方法、系统、设备及介质。
背景技术:
1、语音活性检测(voice activity detection,vad)指的是一种检测语音或音频信号中静默部分的技术,是许多语音/音频应用程序中非常关键的技术,包含语音编码、语音识别、语音增强和音频索引等。
2、应急广播是利用广播电视和新媒体等方式,通过广播电视传输覆盖网和其他信息网络,向公众或特定区域、特定人群发布应急信息的传播系统,是向公众提供应急信息的重要手段,是应急管理体系和公共文化服务体系的重要组成部分。应急广播系统作为一种与语音、音频息息相关的系统,静音/话音分析在其中具有重要作用,但传统的很多应急广播系统并不具有相关功能,进而导致对无用的静音内容进行处理而浪费了运算、存储、网络带宽流量等在嵌入式设备上本就紧张的资源,同时一些现有的语音活性检测算法建模过于复杂不易在嵌入式设备上实现,或只是单纯判断能量级别,缺乏在噪音环境下的稳定性。
3、因此,如何提供一种应急广播语音活性检测方法、系统、设备及介质,实现对应急广播系统的语音活性进行检测,进而降低应急广播系统的资源浪费,并提升语音活性检测的稳定性,成为一个亟待解决的技术问题。
技术实现思路
1、本发明要解决的技术问题,在于提供一种应急广播语音活性检测方法、系统、设备及介质,实现对应急广播系统的语音活性进行检测,进而降低应急广播系统的资源浪费,并提升语音活性检测的稳定性。
2、第一方面,本发明提供了一种应急广播语音活性检测方法,包括如下步骤:
3、步骤s1、获取应急广播系统输入的音频信号,基于设定的帧长度对所述音频信号进行分割,得到若干段音频帧;
4、步骤s2、分别计算各所述音频帧的平均能量;
5、步骤s3、分别对各所述音频帧计算频谱平坦度以及频率;
6、步骤s4、分别计算各所述音频帧的最小平均能量、最小平坦度以及最小频率;
7、步骤s5、设定一能量阈值、一平坦阈值以及一频率阈值,基于所述能量阈值、平坦阈值、频率阈值、平均能量、频谱平坦度、频率、最小平均能量、最小平坦度以及最小频率进行语音活性检测。
8、进一步的,所述步骤s1中,所述帧长度为100毫秒。
9、进一步的,所述步骤s3具体为:
10、分别对各所述音频帧进行快速傅里叶变换,进而计算频谱平坦度以及频率。
11、进一步的,所述步骤s5具体为:
12、设定一能量阈值、一平坦阈值以及一频率阈值;
13、当平均能量-最小平均能量≥能量阈值、频谱平坦度-最小平坦度≥平坦阈值、或者频率-最小频率≥频率阈值,将所述音频帧标记为话音帧;否则,将所述音频帧标记为静音帧,以完成语音活性检测。
14、第二方面,本发明提供了一种应急广播语音活性检测系统,包括如下模块:
15、音频信号分割模块,用于获取应急广播系统输入的音频信号,基于设定的帧长度对所述音频信号进行分割,得到若干段音频帧;
16、平均能量计算模块,用于分别计算各所述音频帧的平均能量;
17、平坦度和频率计算模块,用于分别对各所述音频帧计算频谱平坦度以及频率;
18、最小值计算模块,用于分别计算各所述音频帧的最小平均能量、最小平坦度以及最小频率;
19、语音活性检测模块,用于设定一能量阈值、一平坦阈值以及一频率阈值,基于所述能量阈值、平坦阈值、频率阈值、平均能量、频谱平坦度、频率、最小平均能量、最小平坦度以及最小频率进行语音活性检测。
20、进一步的,所述音频信号分割模块中,所述帧长度为100毫秒。
21、进一步的,所述平坦度和频率计算模块具体用于:
22、分别对各所述音频帧进行快速傅里叶变换,进而计算频谱平坦度以及频率。
23、进一步的,所述语音活性检测模块具体用于:
24、设定一能量阈值、一平坦阈值以及一频率阈值;
25、当平均能量-最小平均能量≥能量阈值、频谱平坦度-最小平坦度≥平坦阈值、或者频率-最小频率≥频率阈值,将所述音频帧标记为话音帧;否则,将所述音频帧标记为静音帧,以完成语音活性检测。
26、第三方面,本发明提供了一种应急广播语音活性检测设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
27、第四方面,本发明提供了一种应急广播语音活性检测介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。
28、本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
29、通过获取应急广播系统输入的音频信号,基于设定的帧长度对音频信号进行分割得到若干段音频帧,分别计算各音频帧的平均能量,再分别对各音频帧计算频谱平坦度以及频率,分别计算各音频帧的最小平均能量、最小平坦度以及最小频率,最后设定能量阈值、平坦阈值以及频率阈值,基于能量阈值、平坦阈值、频率阈值、平均能量、频谱平坦度、频率、最小平均能量、最小平坦度以及最小频率进行语音活性检测,即实现对音频信号的语音活性进行检测,避免对无用的静音帧(静音内容)进行处理而浪费相关资源,且通过平均能量、频谱平坦度以及频率来进行多维的语音活性检测,即使在噪音环境下也能有效识别话音帧和静音帧,最终实现对应急广播系统的语音活性进行检测,进而极大的降低了应急广播系统的资源浪费,并极大的提升了语音活性检测的稳定性。
30、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
技术特征:1.一种应急广播语音活性检测方法,其特征在于:包括如下步骤:
2.如权利要求1所述的一种应急广播语音活性检测方法,其特征在于:所述步骤s1中,所述帧长度为100毫秒。
3.如权利要求1所述的一种应急广播语音活性检测方法,其特征在于:所述步骤s3具体为:
4.如权利要求1所述的一种应急广播语音活性检测方法,其特征在于:所述步骤s5具体为:
5.一种应急广播语音活性检测系统,其特征在于:包括如下模块:
6.如权利要求5所述的一种应急广播语音活性检测系统,其特征在于:所述音频信号分割模块中,所述帧长度为100毫秒。
7.如权利要求5所述的一种应急广播语音活性检测系统,其特征在于:所述平坦度和频率计算模块具体用于:
8.如权利要求5所述的一种应急广播语音活性检测系统,其特征在于:所述语音活性检测模块具体用于:
9.一种应急广播语音活性检测设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述的方法。
10.一种应急广播语音活性检测介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4任一项所述的方法。
技术总结本发明提供了应急广播技术领域的一种应急广播语音活性检测方法、系统、设备及介质,方法包括:步骤S1、获取应急广播系统输入的音频信号,对音频信号进行分割得到若干段音频帧;步骤S2、分别计算各音频帧的平均能量;步骤S3、对各音频帧计算频谱平坦度以及频率;步骤S4、计算各音频帧的最小平均能量、最小平坦度以及最小频率;步骤S5、设定能量阈值、平坦阈值以及频率阈值,基于能量阈值、平坦阈值、频率阈值、平均能量、频谱平坦度、频率、最小平均能量、最小平坦度以及最小频率进行语音活性检测。本发明的优点在于:实现对应急广播系统的语音活性进行检测,进而极大的降低了应急广播系统的资源浪费,并极大的提升了语音活性检测的稳定性。技术研发人员:赵泽钧,袁苇,张宏辉受保护的技术使用者:福建新大陆通信科技股份有限公司技术研发日:技术公布日:2024/1/25本文地址:https://www.jishuxx.com/zhuanli/20240618/21230.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表