技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音环境检测方法及计算机可读存储介质与流程  >  正文

语音环境检测方法及计算机可读存储介质与流程

  • 国知局
  • 2024-06-21 11:26:28

本发明涉及语音识别测试,尤其涉及一种语音环境检测方法及计算机可读存储介质。

背景技术:

1、在ktv行业中,语音点歌功能效果受到环境影响因素较大,在测试环境中检测结果良好,但是实际投入使用后,却经常反馈语音识别不灵敏,识别率差,甚至出现语音输入没反应的情况,市场反响不符合预期。

2、语音点歌调试专业性强,需要专业人员才能进行操作。从硬件角度看,语音点歌调试中,录音接线方案众多,常见的接线方法有语音线接线、语音盒接线、效果器接线、中置接线等。录音设备和接口也是五花八门,常见的录音设备有bbs麦克风,有线麦克风,usb麦克风等,常见录音输入口有莲花头,3.5mm、6.0接口等;从软件角度看,语音点歌调试存在网络相关问题,如网络波动,网络超时等问题,还有存在软件鉴权,软件初始化,软件运行等问题。因此,现有的语音点歌调试均需要专业人员预先调试。

3、语音点歌调试中语音环境问题多而杂,问题排查困难。以语音线接线为例,因这种接线方式施工简单,成本低廉,市场上使用率较高,具体接线方式为:麦克风声音输出一路到效果器再到功放输出,一路直接通过av口输入到点歌机。由于麦克风输出分了两路,导致软件录制效果和人耳朵听到有偏差。人耳听到的效果并非实际录制效果,会干扰用户对录音环境是否正常的判断。此外,麦克风输入到效果器音量不能过大,否则容易造成功放啸叫。比如麦克风最大音量为31,一般只能设置到20左右,不同效果器和功放情况略有区别。从麦克风到效果器功放的链路,声音质量存在增益和效果处理,就算是麦克风输出的音量较小也能通过调节效果器和功放来实现较好的听感效果。而从麦克风到点歌机,输入音量对语音识别效果有较大影响。例如,用同一个声音源,通过克风分线器接入不同机器,录制pcm,对比波形图如图1-2所示,其中,图1为正常的波形图,图2为损耗的波形图,图中的x轴表示时间(s),y轴表示分贝(ddfs)。从录音输入到pcb电路环境再到软件录音,链路本身存在不可避免的音量损耗,不同硬件环境有差别,测试的部分机器,音量损耗大于30%。因为功放啸叫和音量损耗的原因,使得输入音量偏小的问题更为突出。

4、由于语音点歌调试目前没有直观的调试工具,出现语音识别没反应时,用户往往无从得知是哪里出了问题,导致语音点歌功能使用门槛高,用户体验差;对技术人员来说,施工和问题排查成本高。

技术实现思路

1、本发明所要解决的技术问题是:提供一种语音环境检测方法及计算机可读存储介质,可简化语音检测流程,降低用户使用门槛及问题排查成本。

2、为了解决上述技术问题,本发明采用的技术方案为:一种语音环境检测方法,包括:

3、接收测试音频;

4、对所述测试音频进行音量检测,确定所述测试音频的最大分贝值;

5、对所述测试音频进行语音识别,得到语音识别结果,并根据所述语音识别结果与所述测试音频的内容,进行语音识别检测;

6、若满足预设的条件,则判定语音环境检测通过,所述预设的条件包括语音识别检测通过以及所述测试音频的最大分贝值处于预设的音量范围内。

7、本发明还提出一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的方法。

8、本发明的有益效果在于:通过自动化检测流程引导用户一步步排查语音点歌常见问题,降低用户使用门槛,让普通用户自己动手就能检测并处理问题,从而提升用户体验,同时对技术人员来说,降低施工和问题排查的成本。

技术特征:

1.一种语音环境检测方法,其特征在于,包括:

2.根据权利要求1所述的语音环境检测方法,其特征在于,所述对所述测试音频进行音量检测,确定所述测试音频的最大分贝值,包括:

3.根据权利要求2所述的语音环境检测方法,其特征在于,所述对所述测试音频进行音量检测,确定所述测试音频的最大分贝值,还包括:

4.根据权利要求2所述的语音环境检测方法,其特征在于,所述根据所述当前周期音频的动态范围以及预设的采样精度,计算当前周期音频的分贝值,具体为:

5.根据权利要求1所述的语音环境检测方法,其特征在于,所述对所述测试音频进行音量检测,确定所述测试音频的最大分贝值之后,还包括:

6.根据权利要求5所述的语音环境检测方法,其特征在于,所述根据预设的增益值调试音量,具体为:

7.根据权利要求1所述的语音环境检测方法,其特征在于,所述测试音频的内容包括预设的语音唤醒词和语音指令;

8.根据权利要求7所述的语音环境检测方法,其特征在于,所述对所述测试音频进行语音识别,得到语音识别结果,并根据所述语音识别结果与所述测试音频的内容,进行语音识别检测,还包括:

9.根据权利要求1所述的语音环境检测方法,其特征在于,所述预设的条件还包括运行环境检测通过,所述运行环境检测包括网络波动检测、网络超时检测、鉴权检测、初始化检测以及运行时问题检测。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9任一项所述的方法。

技术总结本发明公开了一种语音环境检测方法及计算机可读存储介质,方法包括:接收测试音频;对所述测试音频进行音量检测,确定所述测试音频的最大分贝值;对所述测试音频进行语音识别,得到语音识别结果,并根据所述语音识别结果与所述测试音频的内容,进行语音识别检测;若满足预设的条件,则判定语音环境检测通过,所述预设的条件包括语音识别检测通过以及所述测试音频的最大分贝值处于预设的音量范围内。本发明可简化语音检测流程,降低用户使用门槛及问题排查成本。技术研发人员:邹映君,吴莉,徐继芸受保护的技术使用者:福建星网视易信息系统有限公司技术研发日:技术公布日:2024/2/6

本文地址:https://www.jishuxx.com/zhuanli/20240618/21541.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。