技术新讯 > 乐器声学设备的制造及制作,分析技术 > 文本语音转换的方法和装置与流程  >  正文

文本语音转换的方法和装置与流程

  • 国知局
  • 2024-06-21 11:28:02

本公开的示例实施例总体涉及文本语音转换领域,特别地涉及文本语音转换的方法和装置。

背景技术:

1、文本语音转换(text-to-speech,tts)是将文本转换成语音,从而用于语音辅助技术中的一种技术。文本语音转换用途很广,包括诸如短信息、电子邮件等各种文本信息的阅读、导航系统中导航信息的语音播报等等。

2、文本语音转换所用的关键技术就是语音合成。目前的语音合成技术通常用算法实现,主要包括文本分析、语音合成以及韵律处理等几部分。要合成出高质量的语音,所采用的算法是极为复杂的,因此对机器的要求也非常高。

3、通常,以车载导航系统进行语音播报为例,由于车辆的处理设备计算能力较差,只能采用一些较为基础的文本语音转换算法来进行文本信息到语音播报的转换,从而造成车辆自带的处理设备所输出的语音往往比较生硬且机械,让人听起来很不舒服。为了改善这种情况,有的解决方案是将文本语音转换的操作放到计算能力较强的服务器上来完成,从而使语音播报更加顺畅和自然。

技术实现思路

1、在本公开的第一方面,提供了一种文本语音转换的方法。所述方法包括将文本发送至远程设备以进行文本语音转换;存储从所述远程设备接收到的与所述文本对应的语音;以及在未来的播放点开始播放所述语音,所述播放点基于与所述文本相关联的元数据而确定。

2、在根据本公开的实施例中,将所述文本发送至所述远程设备包括:响应于接收到激活语音播报事件的请求,根据所述语音播报事件确定将要通过语音播放的多条文本以及相关联的所述元数据;以及将所述多条文本中的至少部分文本发送至所述远程设备。

3、在一些实施例中,所述播放点表示时间或者位置。

4、在一些实施例中,所述文本发送至所述远程设备包括:基于可用于存储语音数据的本地存储容量,来确定向所述远程设备发送的文本的量。

5、在一些实施例中,将所述文本发送至所述远程设备包括:确定所述文本被转换为所述语音所需的预计处理时长;响应于到达所述播放点所需的预计等待时长超过所述预计处理时长并且二者之差在预定范围内,将所述文本传输至所述远程设备。

6、在一些实施例中,确定所述预计处理时长包括:基于单个的文本语音转换所需的平均时长和所述文本中包含的字数,来确定针对所述文本的所述预计处理时长。

7、在一些实施例中,确定所述预计处理时长包括:确定与所述远程设备之间的通信状况;确定所述文本和所述语音的数据量;根据所述数据量和所述通信状况来确定所述预计处理时长。

8、在一些实施例中,确定所述等待时长包括:获取当前移动速度;基于所述当前移动速度以及与所述播放点对应的位置,来确定所述预计等待时长。

9、根据本公开实施例的第二方面,提供了一种文本语音转换的装置。该装置包括:发送模块,被配置为将文本发送至远程设备以进行文本语音转换;接收存储模块,被配置为存储从所述远程设备接收到的与所述文本对应的语音;以及播放模块,被配置为在未来的播放点开始播放所述语音,所述播放点基于与所述文本相关联的元数据而确定。

10、在本公开的第三方面,提供了一种电子设备。该设备包括至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令在由至少一个处理单元执行时使设备执行第一方面的方法。

11、在本公开的第四方面,提供了一种计算机可读存储介质。该计算机可读存储介质上存储有计算机程序,计算机程序可由处理器执行以实现第一方面的方法。

12、在本公开的第五方面,提供了一种计算机程序产品。该计算机程序产品包括计算机可执行指令,计算机可执行指令在被处理器执行时实现第一方面的方法。

13、应当理解,本技术实现要素:部分中所描述的内容并非旨在限定本公开的实施例的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。

技术特征:

1.一种文本语音转换的方法,包括:

2.根据权利要求1所述的方法,其中将所述文本发送至所述远程设备包括:

3.根据权利要求1所述的方法,其中所述播放点表示时间或者位置。

4.根据权利要求1所述的方法,其中将所述文本发送至所述远程设备包括:

5.根据权利要求1所述的方法,其中将所述文本发送至所述远程设备包括:

6.根据权利要求5所述的方法,其中确定所述预计处理时长包括:

7.根据权利要求5所述的方法,其中确定所述预计处理时长包括:

8.根据权利要求5所述的方法,其中确定所述等待时长包括:

9.一种文本语音转换的装置,包括:

10.一种电子设备,所述设备包括:

11.一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如权利要求1-8中任一项所述的方法。

12.一种计算机程序产品,包括计算机可执行指令,其中所述计算机可执行指令在被处理器执行时实现如权利要求1-8中任一项所述的方法。

技术总结根据本公开的实施例,提供了文本语音转换的方法和装置。该方法包括将文本发送至远程设备以进行文本语音转换;存储从所述远程设备接收到的与所述文本对应的语音;以及在未来的播放点开始播放所述语音,所述播放点基于与所述文本相关联的元数据而确定。这种文本语音转换的方法能够保证提前完成在线文本语音转换,提高语音播放事件的播放质量的同时提了高用户体验。技术研发人员:金涛,刘凤洋受保护的技术使用者:北京嘀嘀无限科技发展有限公司技术研发日:技术公布日:2024/2/19

本文地址:https://www.jishuxx.com/zhuanli/20240618/21679.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。