技术新讯 > 乐器声学设备的制造及制作,分析技术 > 文本处理方法及装置与流程 > 正文

文本处理方法及装置与流程

国知局
2024-06-21 11:48:33

本申请涉及文本处理，尤其涉及一种文本处理方法及装置。

背景技术：

1、随着人工智能技术的不断发展，语音处理的需求日益迫切；而随着语音处理的需求的多样化发展，对语音数据进行目标语种下的语音识别，以及对待处理文本进行目标语种下的语音合成，逐渐成为语音处理领域关注的热点；

2、目标语种是指目标语言的种类；众所周知，目标语种的数量比较庞大，所以针对目标语种的语音处理技术也在不断迭代更新，在此过程中，对目标语种的语音处理方提出了更高的语音处理要求。

技术实现思路

1、第一方面，本申请实施例提供了一种文本处理方法，包括：

2、在待处理文本中检测目标语种下的异读字符；

3、根据所述异读字符和音序映射关系对所述异读字符的第一音序进行变换处理，得到所述异读字符的第二音序；

4、识别所述待处理文本中的第一字符串，以及将所述第一字符串替换为对应的第二字符串，得到合成文本；

5、对所述合成文本进行语音合成得到第一语音，以及基于所述第二音序和所述合成文本对所述第一语音进行语音修正，得到所述合成文本的第二语音。

6、可以看出，在本申请实施例中，首先，在待处理文本中检测目标语种下的异读字符，并借助异读字符和音序映射关系对异读字符的第一音序进行变换处理，得到异读字符的第二音序，以此提升目标语种下的异读字符的音序丰富度和全面性，其次，将待处理文本中的第一字符串替换为对应的第二字符串，得到合成文本，以此通过字符串替换使得合成文本更加符合第二音序的语音合成环境，进而提升后续的语音合成的有效性，在此基础上，对合成文本进行语音合成得到第一语音，以及借助异读字符的第二音序和合成文本对第一语音进行语音修正，得到合成文本的第二语音，以此，通过语音修正得到合成文本的第二语音，提升目标语种下的语音数据的全面性，进而提升目标语种下的语音处理精确度。

7、第二方面，本申请实施例提供了一种文本处理装置，包括：

8、字符检测模块，用于在待处理文本中检测目标语种下的异读字符；

9、变换处理模块，用于根据所述异读字符和音序映射关系对所述异读字符的第一音序进行变换处理，得到所述异读字符的第二音序；

10、字符串替换模块，用于识别所述待处理文本中的第一字符串，以及将所述第一字符串替换为对应的第二字符串，得到合成文本；

11、语音修正模块，用于对所述合成文本进行语音合成得到第一语音，以及基于所述第二音序和所述合成文本对所述第一语音进行语音修正，得到所述合成文本的第二语音。

12、第三方面，本申请实施例提供了一种计算机设备，包括：处理器；以及，被配置为存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器执行第一方面所述的文本处理方法。

13、第四方面，本申请实施例提供了一种计算机可读存储介质，用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时实现如第一方面所述的文本处理方法。

技术特征：

1.一种文本处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述异读字符和音序映射关系对所述异读字符的第一音序进行变换处理，得到所述异读字符的第二音序，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述第二音序和所述合成文本对所述第一语音进行语音修正，得到所述合成文本的第二语音，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述剩余字符和所述剩余字符的第三音序对所述第一语音进行语音修正，得到所述第二语音，包括：

5.根据权利要求1所述的方法，其特征在于，所述音序映射关系，通过如下方式生成：

6.根据权利要求1所述的方法，其特征在于，所述在待处理文本中检测目标语种下的异读字符，包括：

7.根据权利要求1所述的方法，其特征在于，所述对所述合成文本进行语音合成得到第一语音，包括：

8.一种文本处理装置，其特征在于，所述装置包括：

9.一种计算机设备，其特征在于，所述设备包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时实现如权利要求1-7任一项所述的文本处理方法。

技术总结本说明书实施例提供了文本处理方法及装置，其中，一种文本处理方法包括：在待处理文本中检测目标语种下的异读字符；根据所述异读字符和音序映射关系对所述异读字符的第一音序进行变换处理，得到所述异读字符的第二音序；识别所述待处理文本中的第一字符串，以及将所述第一字符串替换为对应的第二字符串，得到合成文本；对所述合成文本进行语音合成得到第一语音，以及基于所述第二音序和所述合成文本对所述第一语音进行语音修正，得到所述合成文本的第二语音。采用本申请实施例能够提升目标语种下的语音合成精确度。技术研发人员：白安琪受保护的技术使用者：马上消费金融股份有限公司技术研发日：技术公布日：2024/5/6