技术新讯 > 计算推算,计数设备的制造及其应用技术 > 剧情文本处理方法、装置、计算机设备和存储介质与流程 > 正文

剧情文本处理方法、装置、计算机设备和存储介质与流程

国知局
2024-10-09 16:31:23

本技术涉及计算机，特别是涉及一种剧情文本处理方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术：

1、随着人工智能技术的发展，自然语言处理技术不断发展，基于自然语言处理技术的摘要生成模型得到了广泛应用。摘要生成模型旨在获取文本的关键信息，并生成包含关键信息的简短摘要。摘要生成模型可以应用于剧情文本相应的剧情摘要生成，可以理解的是，通过生成剧情摘要可以帮助快速了解剧情内容。

2、传统方法中，通常基于gpt（generative pre-trained transformer，生成式预训练transformer模型）2或者gpt4产生剧情摘要，通过输入某个场次的剧情文本，向gpt提问，就可以得到gpt关于输入剧本的剧情摘要的回答。

3、然而，传统方法中的摘要生成模型虽然可以快速生成剧情摘要，但是容易出现生成的剧情摘要与剧情文本中的内容不符或者措辞不正确的情况，存在所生成的剧情摘要不准确的情况。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够生成准确剧情摘要的剧情文本处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本技术提供了一种剧情文本处理方法。所述方法包括：

3、获取用于训练初始摘要生成模型的多个初始训练样本；所述初始训练样本包括样本剧情文本、样本剧情摘要以及描述所述样本剧情文本中内容的剧本辅助信息，所述剧本辅助信息与所述样本剧情摘要不同；

4、针对每个所述初始训练样本，将所述初始训练样本中的样本剧情文本输入所述初始摘要生成模型进行剧情摘要预测以及辅助信息预测，得到预测剧情摘要以及预测辅助信息特征；

5、根据所述样本剧情摘要、所述预测剧情摘要、所述剧本辅助信息以及所述预测辅助信息特征进行预测损失计算，得到所述初始训练样本对应的预测损失值；

6、根据所述多个初始训练样本各自对应的预测损失值，对所述初始摘要生成模型的参数进行调整，得到训练后的摘要生成模型；所述训练后的摘要生成模型用于基于输入的剧情文本输出剧情摘要。

7、第二方面，本技术还提供了一种剧情文本处理装置。所述装置包括：

8、获取模块，用于获取用于训练初始摘要生成模型的多个初始训练样本；所述初始训练样本包括样本剧情文本、样本剧情摘要以及描述所述样本剧情文本中内容的剧本辅助信息，所述剧本辅助信息与所述样本剧情摘要不同；

9、预测模块，用于针对每个所述初始训练样本，将所述初始训练样本中的样本剧情文本输入所述初始摘要生成模型进行剧情摘要预测以及辅助信息预测，得到预测剧情摘要以及预测辅助信息特征；

10、损失估计模块，用于根据所述样本剧情摘要、所述预测剧情摘要、所述剧本辅助信息以及所述预测辅助信息特征进行预测损失计算，得到所述初始训练样本对应的预测损失值；

11、参数调整模块，用于根据所述多个初始训练样本各自对应的预测损失值，对所述初始摘要生成模型的参数进行调整，得到训练后的摘要生成模型；所述训练后的摘要生成模型用于基于输入的剧情文本输出剧情摘要。

12、第三方面，本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

13、获取用于训练初始摘要生成模型的多个初始训练样本；所述初始训练样本包括样本剧情文本、样本剧情摘要以及描述所述样本剧情文本中内容的剧本辅助信息，所述剧本辅助信息与所述样本剧情摘要不同；

14、针对每个所述初始训练样本，将所述初始训练样本中的样本剧情文本输入所述初始摘要生成模型进行剧情摘要预测以及辅助信息预测，得到预测剧情摘要以及预测辅助信息特征；

15、根据所述样本剧情摘要、所述预测剧情摘要、所述剧本辅助信息以及所述预测辅助信息特征进行预测损失计算，得到所述初始训练样本对应的预测损失值；

16、根据所述多个初始训练样本各自对应的预测损失值，对所述初始摘要生成模型的参数进行调整，得到训练后的摘要生成模型；所述训练后的摘要生成模型用于基于输入的剧情文本输出剧情摘要。

17、第四方面，本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

18、获取用于训练初始摘要生成模型的多个初始训练样本；所述初始训练样本包括样本剧情文本、样本剧情摘要以及描述所述样本剧情文本中内容的剧本辅助信息，所述剧本辅助信息与所述样本剧情摘要不同；

19、针对每个所述初始训练样本，将所述初始训练样本中的样本剧情文本输入所述初始摘要生成模型进行剧情摘要预测以及辅助信息预测，得到预测剧情摘要以及预测辅助信息特征；

20、根据所述样本剧情摘要、所述预测剧情摘要、所述剧本辅助信息以及所述预测辅助信息特征进行预测损失计算，得到所述初始训练样本对应的预测损失值；

21、根据所述多个初始训练样本各自对应的预测损失值，对所述初始摘要生成模型的参数进行调整，得到训练后的摘要生成模型；所述训练后的摘要生成模型用于基于输入的剧情文本输出剧情摘要。

22、第五方面，本技术还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

23、获取用于训练初始摘要生成模型的多个初始训练样本；所述初始训练样本包括样本剧情文本、样本剧情摘要以及描述所述样本剧情文本中内容的剧本辅助信息，所述剧本辅助信息与所述样本剧情摘要不同；

24、针对每个所述初始训练样本，将所述初始训练样本中的样本剧情文本输入所述初始摘要生成模型进行剧情摘要预测以及辅助信息预测，得到预测剧情摘要以及预测辅助信息特征；

25、根据所述样本剧情摘要、所述预测剧情摘要、所述剧本辅助信息以及所述预测辅助信息特征进行预测损失计算，得到所述初始训练样本对应的预测损失值；

26、根据所述多个初始训练样本各自对应的预测损失值，对所述初始摘要生成模型的参数进行调整，得到训练后的摘要生成模型；所述训练后的摘要生成模型用于基于输入的剧情文本输出剧情摘要。

27、上述剧情文本处理方法、装置、计算机设备、存储介质和计算机程序产品，在获取用于训练初始摘要生成模型的多个初始训练样本的基础上，通过针对每个初始训练样本，将初始训练样本中的样本剧情文本输入初始摘要生成模型进行剧情摘要预测以及辅助信息预测，能够得到预测剧情摘要以及预测辅助信息特征，进而可以利用样本剧情摘要、预测剧情摘要、剧本辅助信息以及预测辅助信息特征来进行预测损失计算，得到初始训练样本对应的预测损失值，从而可以通过根据多个初始训练样本各自对应的预测损失值，对初始摘要生成模型的参数进行调整的方式，得到训练后的摘要生成模型，整个过程，在对初始摘要生成模型进行训练时，通过级联剧本辅助信息的预测到初始摘要生成模型中，能够让初始摘要生成模型从剧本辅助信息中理解到摘要相关的正确信息，并支持剧情摘要生成，能够避免剧情摘要输出对剧情文本产生错误理解的情况，可以得到能够输出准确的剧情摘要的摘要生成模型，通过将剧情文本输入训练后的摘要生成模型即可实现生成准确剧情摘要。