技术新讯 > 电子通信装置的制造及其应用技术 > 一种剧情分割方法、装置、电子设备及存储介质与流程  >  正文

一种剧情分割方法、装置、电子设备及存储介质与流程

  • 国知局
  • 2024-08-02 14:36:25

本发明涉及信息,特别是涉及一种剧情分割方法、装置、电子设备及存储介质。

背景技术:

1、目前,在视频领域,往往需要进行视频的分割。例如,针对电影或电视剧,在进行剧本创作、短视频推荐、自动生成预告片等。在进行视频分割时,需要将一个描述了多事件的复杂文本,根据事件分割成多段文本,每段文本都描述一个相对简单但完备的小事件。然而,现有的文本处理方法大多通过人工的方法进行分割,不但人工成本高,而且剧情分割效率低。

技术实现思路

1、本发明实施例的目的在于提供一种剧情分割方法、装置、电子设备及存储介质,以实现提高剧情分割的效率。具体技术方案如下:

2、在本发明实施的第一方面,首先提供了一种剧情分割方法,所述方法包括:

3、获取待分割剧情文本和所述待分割剧情文本对应的视频,其中,每个所述待分割剧情文本包括多个子文本单元,所述多个子文本单元是预先对所述待分割剧情文本进行语义分割得到的,所述视频包括多个子片段,每个所述子片段与一个所述子文本单元对应;

4、获取所述视频中每个子片段的时间特征;

5、根据每个所述子文本单元对应的所述子片段的时间特征,对所述多个子文本单元进行分组,得到多个文本分组;

6、根据每个文本分组中包括的子片段,确定所述待分割剧情文本中子剧情的分割位置,其中,每个所述分组对应一个所述子剧情。

7、在一种可能的实施方式中,所述根据每个所述子文本单元对应的所述子片段的时间特征,对所述多个子文本单元进行分组,得到多个文本分组,包括:

8、从多个所述子文本单元对应的,多个所述子片段的时间特征中选取多个目标时间特征;

9、分别以每一目标时间特征为中心,计算其它时间特征中每一个待选时间特征到每一目标时间特征的距离;

10、分别针对每一目标时间特征,计算其它待选时间特征到该目标时间特征的距离之和,得到第一距离和;计算每一目标时间特征对应的第一距离和的总和,得到第二距离和;

11、重新选取多个目标时间,并返回所述分别以每一目标时间特征为中心,计算其它时间特征中每一个待选时间特征到每一目标时间特征的距离的步骤继续执行,直至达到预设迭代停止条件;

12、选取对应第二距离和最小的多个目标时间特征;

13、已选取多个目标时间特征为中心,将其它待选时间特征与距离最近的目标时间特征归为一组,得到多个时间特征分组;

14、根据所述时间特征分组,对所述多个子文本单元进行分组,得到多个文本分组。

15、在一种可能的实施方式中,在所述从多个所述子文本单元对应的,多个所述子片段的时间特征中选取多个目标时间特征之前,所述方法还包括:

16、获取预设聚类数量;

17、所述从多个所述子文本单元对应的,多个所述子片段的时间特征中选取多个目标时间特征,包括:

18、从多个所述子文本单元对应的,多个所述子片段的时间特征中选取所述预设聚类数量个目标时间特征;

19、所述根据所述时间特征分组,对所述多个子文本单元进行分组,得到多个文本分组,包括:

20、根据所述时间特征分组,对所述多个子文本单元进行分组,得到所述预设聚类数量个文本分组。

21、在一种可能的实施方式中,所述获取所述视频中每个子片段的时间特征,包括:

22、识别所述视频中每个子片段对应的起始时间和/或截止时间;

23、根据每个子片段对应的起始时间和/或截止时间,计算每个子片段的时间特征。

24、在一种可能的实施方式中,所述根据每个子片段对应的起始时间和/或截止时间,计算每个子片段的时间特征,包括:

25、将每个子片段对应的截止时间,作为每个子片段的时间特征。

26、在一种可能的实施方式中,所述根据每个子片段对应的起始时间和/或截止时间,计算每个子片段的时间特征,包括:

27、计算每个子片段对应的起始时间和截止时间的中间值,并将计算结果作为每个子片段的时间特征。

28、在本发明实施的第二方面,还提供了一种剧情分割装置,所述装置包括:

29、文本获取模块,用于获取待分割剧情文本和所述待分割剧情文本对应的视频,其中,每个所述待分割剧情文本包括多个子文本单元,所述多个子文本单元是预先对所述待分割剧情文本进行语义分割得到的,所述视频包括多个子片段,每个所述子片段与一个所述子文本单元对应;

30、特征获取模块,用于获取所述视频中每个子片段的时间特征;

31、文本分组模块,用于根据每个所述子文本单元对应的所述子片段的时间特征,对所述多个子文本单元进行分组,得到多个文本分组;

32、位置确定模块,用于根据每个文本分组中包括的子片段,确定所述待分割剧情文本中子剧情的分割位置,其中,每个所述分组对应一个所述子剧情。

33、在一种可能的实施方式中,所述文本分组模块,包括:

34、目标选取子模块,用于从多个所述子文本单元对应的,多个所述子片段的时间特征中选取多个目标时间特征;

35、距离计算子模块,用于分别以每一目标时间特征为中心,计算其它时间特征中每一个待选时间特征到每一目标时间特征的距离;

36、第一距离和计算子模块,用于分别针对每一目标时间特征,计算其它待选时间特征到该目标时间特征的距离之和,得到第一距离和;

37、第二距离和计算子模块,用于计算每一目标时间特征对应的第一距离和的总和,得到第二距离和;

38、迭代子模块,用于重新选取多个目标时间,并返回所述分别以每一目标时间特征为中心,计算其它时间特征中每一个待选时间特征到每一目标时间特征的距离的步骤继续执行,直至达到预设迭代停止条件;

39、特征选取子模块,用于选取对应第二距离和最小的多个目标时间特征;

40、特征分组子模块,用于已选取多个目标时间特征为中心,将其它待选时间特征与距离最近的目标时间特征归为一组,得到多个时间特征分组;

41、文本分组子模块,用于根据所述时间特征分组,对所述多个子文本单元进行分组,得到多个文本分组。

42、在一种可能的实施方式中,所述装置还包括:数量获取子模块;

43、所述数量获取子模块,用于获取预设聚类数量;

44、所述目标选取子模块,具体用于从多个所述子文本单元对应的,多个所述子片段的时间特征中选取所述预设聚类数量个目标时间特征;

45、所述文本分组子模块,具体用于根据所述时间特征分组,对所述多个子文本单元进行分组,得到所述预设聚类数量个文本分组。

46、在一种可能的实施方式中,所述特征获取模块,具体用于识别所述视频中每个子片段对应的起始时间和/或截止时间;根据每个子片段对应的起始时间和/或截止时间,计算每个子片段的时间特征。

47、在一种可能的实施方式中,所述特征获取模块,具体用于将每个子片段对应的截止时间,作为每个子片段的时间特征。

48、在一种可能的实施方式中,所述特征获取模块,具体用于计算每个子片段对应的起始时间和截止时间的中间值,并将计算结果作为每个子片段的时间特征。

49、在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

50、存储器,用于存放计算机程序;

51、处理器,用于执行存储器上所存放的程序时,实现上述任一所述的剧情分割方法。

52、在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的剧情分割方法。

53、在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的剧情分割方法。

54、本发明实施例提供的一种剧情分割方法、装置、电子设备及存储介质,其中,该剧情分割方法包括:获取待分割剧情文本和所述待分割剧情文本对应的视频,其中,每个所述待分割剧情文本包括多个子文本单元,所述多个子文本单元是预先对所述待分割剧情文本进行语义分割得到的,所述视频包括多个子片段,每个所述子片段与一个所述子文本单元对应;获取所述视频中每个子片段的时间特征;根据每个所述子文本单元对应的所述子片段的时间特征,对所述多个子文本单元进行分组,得到多个文本分组;根据每个文本分组中包括的子片段,确定所述待分割剧情文本中子剧情的分割位置,其中,每个所述分组对应一个所述子剧情。通过本技术实施例提供的方案,可以通过获取待分割剧情文本和所述待分割剧情文本对应的视频,以及获取所述视频中每个子片段的时间特征,从而根据每个子片段的时间特征对所述多个子文本单元进行分组,最后根据分组确定所述待分割剧情文本中子剧情的分割位置,从而实现视频的自动分割,提高剧情分割的效率。

本文地址:https://www.jishuxx.com/zhuanli/20240801/243360.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。