技术新讯 > 乐器声学设备的制造及制作,分析技术 > 文本信息的处理方法、装置、设备及存储介质与流程  >  正文

文本信息的处理方法、装置、设备及存储介质与流程

  • 国知局
  • 2024-06-21 11:36:15

本申请涉及自然语言,特别涉及一种文本信息的处理方法、装置、设备及存储介质。

背景技术:

1、随着互联网技术的发展,用户以有声书的方式收听小说内容的需求日益增长。

2、在相关技术中,利用人工神经网络能够实现将小说的文本转换为音频,实现小说的有声书的生成。

3、然而,上述小说的有声书生成方式较为单一。

技术实现思路

1、本申请提供了一种文本信息的处理方法、装置、设备及存储介质,所述技术方案如下:

2、根据本申请的一方面,提供了一种文本信息的处理方法,所述方法包括:

3、获取文学作品,所述文学作品是包括多个字符的自然语言信息;

4、在所述文学作品中确定出对话文本和旁白文本,所述对话文本是至少一个角色发起交流的文本,所述旁白文本是所述文学作品中除去所述对话文本以外的信息;

5、基于所述旁白文本以语音合成方式生成第一音频;以及基于所述对话文本以录制方式生成第二音频;

6、拼接所述第一音频和所述第二音频,得到所述文学作品对应的播报音频。

7、根据本申请的另一方面,提供了一种文本信息的处理装置,所述装置包括:

8、获取模块,用于获取文学作品,所述文学作品是包括多个字符的自然语言信息;

9、处理模块,用于在所述文学作品中确定出对话文本和旁白文本,所述对话文本是至少一个角色发起交流的文本,所述旁白文本是所述文学作品中除去所述对话文本以外的信息;

10、生成模块,用于基于所述旁白文本以语音合成方式生成第一音频;以及基于所述对话文本以录制方式生成第二音频;

11、所述处理模块,还用于拼接所述第一音频和所述第二音频,得到所述文学作品对应的播报音频。

12、根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的文本信息的处理方法。

13、根据本申请的另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的文本信息的处理方法。

14、根据本申请的另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,处理器从所述计算机可读存储介质读取并执行所述计算机指令,以实现上述如上方面所述的文本信息的处理方法。

15、本申请提供的技术方案带来的有益效果至少包括:

16、通过在文本信息中确定出对话信息和旁白信息,区分了文本信息中不同类型的文本内容;充分考虑了对话文本具有浓厚的情感表达的特点,以录制方式获取第二音频,保证了对话文本对应的第二音频的情感表达的饱满;旁白文本是用于描述事件和情节的文本内容,以语音合成方式快速生成第一音频,提高了音频获取的效率;丰富了文本信息对应的播报音频的生成方式,兼顾了播报音频中情感表达的饱满和生成效率。

技术特征:

1.一种文本信息的处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述在所述文学作品中确定出对话文本和旁白文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个语句标签,在所述文学作品中添加标识符,包括:

4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求4所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:

9.根据权利要求8所述的方法,其特征在于,所述方法还包括:

10.根据权利要求9所述的方法,其特征在于,所述基于所述对话文本,构建所述对话文本的文本发音序列,包括:

11.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:

12.根据权利要求11所述的方法,其特征在于,所述在所述第一音频中叠加所述音效名称对应的音效音频,包括:

13.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:

14.根据权利要求13所述的方法,其特征在于,所述方法还包括:

15.一种文本信息的处理装置,其特征在于,所述装置包括:

16.一种计算机设备,其特征在于,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一段程序;所述处理器,用于执行所述存储器中的所述至少一段程序以实现上述如权利要求1至14任一所述的文本信息的处理方法。

17.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有可执行指令,所述可执行指令由处理器加载并执行以实现上述如权利要求1至14任一所述的文本信息的处理方法。

18.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,处理器从所述计算机可读存储介质读取并执行所述计算机指令,以实现上述如权利要求1至14任一所述的文本信息的处理方法。

技术总结本申请公开了一种文本信息的处理方法、装置、设备及存储介质,属于自然语言技术领域。该方法包括:获取文学作品,文学作品是包括多个字符的自然语言信息;在文学作品中确定出对话文本和旁白文本,对话文本是至少一个角色发起交流的文本,旁白文本是文学作品中除去对话文本以外的信息;基于旁白文本以语音合成方式生成第一音频;以及基于对话文本以录制方式生成第二音频;拼接第一音频和第二音频,得到文学作品对应的播报音频。通过在文本信息中确定出对话信息和旁白信息;充分考虑了对话文本具有浓厚的情感表达的特点,以录制方式获取第二音频,保证了对话文本对应的第二音频的情感表达的饱满,兼顾播报音频中情感表达的饱满和生成效率。技术研发人员:黄杰雄,高阳升,谭家俊,缪晓鋆,李剑扬,江景敏,轩晓光受保护的技术使用者:广州酷狗计算机科技有限公司技术研发日:技术公布日:2024/3/12

本文地址:https://www.jishuxx.com/zhuanli/20240618/22324.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。