技术新讯 > 乐器声学设备的制造及制作,分析技术 > 角色预测方法及相关方法、装置、设备和存储介质与流程 > 正文

角色预测方法及相关方法、装置、设备和存储介质与流程

国知局
2024-06-21 11:47:28

本申请涉及人工智能，特别是涉及一种角色预测方法及相关方法、装置、设备和存储介质。

背景技术：

1、随着信息技术的发展，语音合成在众多领域受到越来越多的关注。通过语音合成技术，能够在众多领域尽可能地减少人工配音，时间成本和人力成本得以大幅缩减。

2、在语音合成过程中，对话归属角色是语音合成的重要一环。然而，在实际应用过程中，并非所有对话都明确注明归属角色。在此情形下，需要预测对话归属角色。目前，主要通过规则判断、特征工程等方式判断对话归属角色，预测准确性通常难以保证。有鉴于此，如何提升对话角色的预测准确性，成为亟待解决的问题。

技术实现思路

1、本申请主要解决的技术问题是提供一种角色预测方法及相关方法、装置、设备和存储介质，能够提升对话归属角色的预测准确性。

2、为了解决上述技术问题，本申请第一方面提供了一种角色预测方法，包括：获取目标篇章中待预测归属角色的对话文本，并从目标篇章中提取包含对话文本的上下文文本；基于上下文文本、对话文本和提示文本，构造至少一个目标文本；其中，提示文本用于指示人工智能模型参考上下文文本预测对话文本的归属角色；基于人工智能模型分别处理各个目标文本，得到对话文本归属的目标角色；其中，样本篇章中样本对话文本和包含样本对话文本的样本上下文文本，与表述不同且含义相同的各个样本提示文本分别构造得到样本目标文本，样本提示文本用于指示人工智能模型参考样本上下文文本预测样本对话文本的归属角色，且人工智能模型基于样本目标文本训练得到。

3、为了解决上述技术问题，本申请第二方面提供了一种有声篇章合成方法，包括：预测待合成篇章中对话文本归属的目标角色；其中，目标角色基于上述第一方面中的角色预测方法得到；基于对话文本归属的目标角色对对话文本进行语音合成，得到对话文本的合成音频；基于待合成篇章中各个对话文本的合成音频，得到待合成篇章的目标音频。

4、为了解决上述技术问题，本申请第三方面提供了一种角色预测装置，包括：获取模块、构造模块和预测模块，获取模块，用于获取目标篇章中待预测归属角色的对话文本，并从目标篇章中提取包含对话文本的上下文文本；构造模块，用于基于上下文文本、对话文本和提示文本，构造至少一个目标文本；其中，提示文本用于指示人工智能模型参考上下文文本预测对话文本的归属角色；预测模块，用于基于人工智能模型分别处理各个目标文本，得到对话文本归属的目标角色；其中，样本篇章中样本对话文本和包含样本对话文本的样本上下文文本，与表述不同且含义相同的各个样本提示文本分别构造得到样本目标文本，样本提示文本用于指示人工智能模型参考样本上下文文本预测样本对话文本的归属角色，且人工智能模型基于样本目标文本训练得到。

5、为了解决上述技术问题，本申请第四方面提供了一种有声篇章合成装置，包括：角色预测模块、语音合成模块和音频获取模块，角色预测模块，用于预测待合成篇章中对话文本归属的目标角色；其中，目标角色上述第三方面中的角色预测装置得到；语音合成模块，用于基于对话文本归属的目标角色对对话文本进行语音合成，得到对话文本的合成音频；音频获取模块，用于基于待合成篇章中各个对话文本的合成音频，得到待合成篇章的目标音频。

6、为了解决上述技术问题，本申请第五方面提供了一种电子设备，包括相互耦接的存储器和处理器，存储器中存储有程序指令，处理器用于执行程序指令以实现上述第一方面中的角色预测方法，或实现上述第二方面中的有声篇章合成方法。

7、为了解决上述技术问题，本申请第六方面提供了一种计算机可读存储介质，存储有能够被处理器运行的程序指令，程序指令用于实现上述第一方面的角色预测方法，或实现上述第二方面中的有声篇章合成方法。

8、上述方案，获取目标篇章中待预测归属角色的对话文本，并从目标篇章中提取包含对话文本的上下文文本，再基于上下文文本、对话文本和提示文本，构造至少一个目标文本，且提示文本用于指示人工智能模型参考上下文文本预测对话文本的归属角色，从而基于人工智能模型分别处理各个目标文本，得到对话文本归属的目标角色，且样本篇章中样本对话文本和包含样本对话文本的样本上下文文本，与表述不同且含义相同的各个样本提示文本分别构造得到样本目标文本，样本提示文本用于指示人工智能模型参考样本上下文文本预测样本对话文本的归属角色，人工智能模型基于样本目标文本训练得到，一方面通过人工智能模型对由上下文文本、对话文本和提示文本所构造的至少一个目标文本进行预测得到对话文本归属的目标角色，能够尽可能地免于因规则不适配、信息抽取质量低等因素而影响角色预测，另一方面在对人工智能模型训练过程中通过表述不同且含义相同的各个样本提示文本构造得到不同样本目标文本以对人工智能模型进行训练，能够尽可能地对训练样本数据进行数据增强，有助于缓解实际应用过程中可能存在的标注数据不足等问题，使得人工智能模型通过训练充分学习。故此，能够提升对话归属角色的预测准确性。

技术特征：

1.一种角色预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述样本目标文本中还包含所述样本对话文本归属的真实角色，所述人工智能模型的训练步骤包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述样本目标文本进行分词，得到构成所述样本目标文本的若干词语之后，以及所述遮蔽所述目标词语，并随机遮蔽所述目标词语以外的词语之前，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，基于人工智能模型分别处理各个所述目标文本，得到所述对话文本归属的目标角色，包括：

5.根据权利要求1至4任一项所述的方法，其特征在于，所述样本目标文本的构造步骤包括：

6.一种有声篇章合成方法，其特征在于，包括：

7.一种角色预测装置，其特征在于，包括：

8.一种有声篇章合成装置，其特征在于，包括：

9.一种电子设备，其特征在于，至少包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现权利要求1至5任一项所述的角色预测方法，或权利要求6所述的有声篇章合成方法。

10.一种计算机可读存储介质，其特征在于，存储有能够被处理器运行的程序指令，所述程序指令用于实现权利要求1至5任一项所述的角色预测方法，或权利要求6所述的有声篇章合成方法。

技术总结本申请公开了一种角色预测方法及相关方法、装置、设备和存储介质，其中，角色预测方法包括：获取目标篇章中待预测归属角色的对话文本，并从目标篇章中提取包含对话文本的上下文文本；基于上下文文本、对话文本和提示文本，构造至少一个目标文本；基于人工智能模型分别处理各个目标文本，得到对话文本归属的目标角色；其中，样本篇章中样本对话文本和包含样本对话文本的样本上下文文本，与表述不同且含义相同的各个样本提示文本分别构造得到样本目标文本，样本提示文本用于指示人工智能模型参考样本上下文文本预测样本对话文本的归属角色，且人工智能模型基于样本目标文本训练得到。上述方案，能够提升对话角色的预测准确性。技术研发人员：刘霞,刘丹,刘权,王士进,刘聪,胡国平,陈凌辉受保护的技术使用者：科大讯飞股份有限公司技术研发日：技术公布日：2024/4/29