技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音信号的处理方法、装置及电子设备与流程  >  正文

语音信号的处理方法、装置及电子设备与流程

  • 国知局
  • 2024-06-21 11:50:41

本技术涉及计算机领域,具体而言,涉及一种语音信号的处理方法、装置及电子设备。

背景技术:

1、目前,在进行语音通话的过程中,采集设备进行声音采集得到声音信号,将采集的声音信号经过音频编码器压缩编码为音频码流数据,并将音频码流数据通过传输网络传送到接收方;接收方通过音频解码器对接收到的音频码流数据解码,将其还原语音信号,并将还原的语音信号进行播放。

2、由于音频码流数据通过传输网络进行传输,如果因无线信号覆盖强度较弱,传输网络链路中的某一段出现传输质量差,则会出现丢包、带宽受限等传输异常的情况,从而影响通话质量。由此可见,相关技术中的语音通话的处理方法,存在由于传输网络出现网络异常导致的通话质量差的问题。

技术实现思路

1、本技术实施例提供了一种语音信号的处理方法、装置及电子设备,以至少相关技术中的语音通话的处理方法存在由于传输网络出现网络异常导致的通话质量差的问题。

2、根据本技术实施例的一个方面,提供了一种语音信号的处理方法,包括:在与第一通话端进行语音通话的过程中,在所述第一通话端与当前的第二通话端之间的传输网络出现异常的情况下,接收所述第一通话端发送的目标数据包,其中,所述目标数据包中携带有目标文字信息;对所述目标文字信息执行语音合成操作,得到与所述目标文字信息对应的第一语音信号;通过所述第二通话端上的语音播放部件播放所述第一语音信号。

3、根据本技术实施例的另一方面,还提供了一种语音信号的处理方法,包括:在与第二通话端进行语音通话的过程中,在当前的第一通话端与所述第二通话端之间的传输网络出现异常的情况下,获取待传输的目标语音信号;通过对所述目标语音信号进行语音识别,将所述目标语音信号转换为目标文字信息;通过所述传输网络将目标数据包发送给所述第二通话端,其中,所述目标数据包中携带有所述目标文字信息。

4、作为一种可选的方案,所述方法还包括:对所述目标语音信号进行语速检测,得到与所述目标语音信号对应的语速参数信息,其中,目标数据包中还携带有所述语速参数信息。

5、作为一种可选的方案,所述方法还包括:从所述第一通话端的语音采集部件所采集到的第二语音信号中提取出所述目标通话对象的声音特征;将与所述一组预设声音模型中的每个预设声音模型对应的声音特征和所述目标通话对象的声音特征分别进行匹配,得到所述每个预设声音模型与所述目标通话对象的匹配度将所述一组预设声音模型中,与所述目标通话对象的匹配度最高的预设声音模型的模型标识,确定为目标模型标识,其中,所述目标模型标识被发送给了所述第二通话端。

6、根据本技术实施例的又一方面,还提供了一种语音信号的处理装置,包括:第一接收单元,用于在与第一通话端进行语音通话的过程中,在所述第一通话端与当前的第二通话端之间的传输网络出现异常的情况下,接收所述第一通话端发送的目标数据包,其中,所述目标数据包中携带有目标文字信息;执行单元,用于对所述目标文字信息执行语音合成操作,得到与所述目标文字信息对应的第一语音信号;播放单元,用于通过所述第二通话端上的语音播放部件播放所述第一语音信号。

7、作为一种可选的方案,所述装置还包括:第二接收单元,用于接收所述第一通话端通过所述传输网络周期性地发送的语音数据包;第一确定单元,用于根据所述语音数据包的接收结果与所述语音数据包的预期接收结果,确定所述传输网络的网络状态,其中,所述传输网络的网络状态用于表示所述传输网络是否存在异常;第一发送单元,用于根据所述传输网络的网络状态,向所述第一通话端发送第一指示信息,其中,所述第一指示信息用于指示所述传输网络是否存在异常。

8、作为一种可选的方案,所述第一确定单元包括:第一确定模块,用于根据接收到的所述语音数据包的数量与预期接收到的所述语音数据包的数量,确定所述语音数据包的丢包率;第二确定模块,用于在所述语音数据包的丢包率大于或者等于丢包率阈值的情况下,确定所述传输网络存在异常;第三确定模块,用于在所述语音数据包的丢包率小于丢包率阈值的情况下,确定所述传输网络正常。

9、作为一种可选的方案,所述装置还包括:第三接收单元,用于接收所述第一通话端通过所述传输网络按照包长度由小到达的顺序依次发送的多组探测包,其中,所述多组探测包中的每组探测包括包长度相同的多个探测包,不同组探测包对应的包长度是不同的;第二确定单元,用于根据所述每组探测包的接收结果与所述每组探测包的预期接收结果,确定与所述传输网络对应的带宽探测值,其中,所述带宽探测值为所述多组探测包中接收结果与预期接收结果一致的所有组探测包所对应的包长度中的最大包长度;第三确定单元,用于在所述带宽探测值大于或者等于带宽探测阈值的情况下,确定所述传输网络存在异常;第四确定单元,用于在所述带宽探测值小于带宽探测阈值的情况下,确定所述传输网络正常;第二发送单元,用于向所述第一通话端发送第二指示信息,其中,所述第二指示信息用于指示所述传输网络是否存在异常。

10、作为一种可选的方案,所述第三接收单元包括:接收模块,用于接收所述第一通话端通过所述传输网络发送的目标组探测包,其中,所述目标组探测包与目标包长度对应;第一发送模块,用于在所述目标组探测包的接收结果与所述目标组探测包的预期接收结果一致的情况下,向所述第一通话端发送第三指示信息,其中,所述第三指示信息用于指示所述第一通话端继续发送下一组探测包,所述下一组探测包对应的包长度大于所述目标包长度;第二发送模块,用于在所述目标组探测包的接收结果与所述目标组探测包的预期接收结果不一致的情况下,向所述第一通话端发送第四指示信息,其中,所述第四指示信息用于指示所述第一通话端停止发送探测包。

11、作为一种可选的方案,所述执行单元包括:执行模块,用于使用与所述第一通话端匹配的目标声音模型对所述目标文字信息执行文字转语音的转换操作,得到所述第一语音信号。

12、作为一种可选的方案,所述装置还包括:查找单元,用于在所述使用与所述第一通话端匹配的目标声音模型对所述目标文字信息执行文字转语音的转换操作之前,使用所述第一通话端的目标通话对象的目标对象标识查找与所述目标对象标识匹配的声音模型;第五确定单元,用于在查找到与所述目标对象标识匹配的声音模型的情况下,将与所述目标对象标识匹配的声音模型,确定为所述目标声音模型;第六确定单元,用于在未查找到与所述目标对象标识匹配的声音模型的情况下,将一组预设声音模型中,目标模型标识所标识的声音模型,确定为所述目标声音模型,其中,所述目标模型标识是由所述第一通话端所指示的模型标识。

13、作为一种可选的方案,所述装置还包括:提取单元,用于从所述第一通话端的语音采集部件所采集到的第二语音信号中提取出所述目标通话对象的声音特征;匹配单元,用于将与所述一组预设声音模型中的每个预设声音模型对应的声音特征和所述目标通话对象的声音特征分别进行匹配,得到所述每个预设声音模型与所述目标通话对象的匹配度;第七确定单元,用于将所述一组预设声音模型中,与所述目标通话对象的匹配度最高的预设声音模型的模型标识,确定为所述目标模型标识。

14、作为一种可选的方案,所述装置还包括:调整单元,用于在所述对所述目标文字信息执行语音合成操作,得到与所述目标文字信息对应的第一语音信号之后,按照语速参数信息所指示的语速参数调整所述第一语音信号的语速参数,得到调整后的所述第一语音信号,其中,所述语速参数信息携带在所述目标数据包中。

15、作为一种可选的方案,所述第一通话端至所述第二通话端的传输链路为所述传输网络中的第一传输链路,所述第二通话端至所述第一通话端的传输链路为所述传输网络中的第二传输链路;所述装置还包括:第一采集单元,用于在所述第二传输链路正常的情况下,通过所述第二通话端的语音采集部件进行语音采集,得到第三语音信号;编码单元,用于对所述第三语音信号进行语音编码,得到与所述第三语音信号对应的音频码流数据;传输单元,用于将所述音频码流数据通过所述第二传输链路传输给所述第一通话端。

16、作为一种可选的方案,所述装置还包括:第二采集单元,用于在所述传输网络出现异常的情况下,通过所述第一通话端的语音采集部件进行语音采集,得到目标语音信号;识别单元,用于通过对所述目标语音信号进行语音识别,将所述目标语音信号转换为所述目标文字信息;第三发送单元,用于通过所述传输网络将携带有所述目标文字信息的所述目标数据包发送给所述第二通话端。

17、根据本技术实施例的又一方面,还提供了一种语音信号的处理装置,包括:获取单元,用于在与第二通话端进行语音通话的过程中,在当前的第一通话端与所述第二通话端之间的传输网络出现异常的情况下,获取待传输的目标语音信号;转换单元,用于通过对所述目标语音信号进行语音识别,将所述目标语音信号转换为目标文字信息;发送单元,用于通过所述传输网络将目标数据包发送给所述第二通话端,其中,所述目标数据包中携带有所述目标文字信息。

18、根据本技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述语音信号的处理方法。

19、根据本技术实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上语音信号的处理方法。

20、根据本技术实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的语音信号的处理方法。

21、在本技术实施例中,在进行语音通话的过程中,如果发送端(发送方的终端设备)与接收端(接收方的终端设备)之间的传输网络出现异常(比如,弱网环境),发送端通过传输网络向接收方发送携带文字信息的数据包,相对于语音数据,文字信息的数据量更小,可以提高在弱网环境下信息传输的成功率;同时,在接收方,在语音通话的过程中如果接收到传输的文字信息,则通过语音合成的方式将文字信息还原为语音信号,无需接收方的通话人执行其他操作,即,仍然可以通过语音收听的方式进行语音通话,可以保证语音通话的便捷性,从而达到提高语音通话的通话质量的技术效果,进而解决了相关技术中的语音通话的处理方法存在由于传输网络出现网络异常导致的通话质量差的问题。

本文地址:https://www.jishuxx.com/zhuanli/20240618/23924.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。