技术新讯 > 电子通信装置的制造及其应用技术 > 视频生成方法、装置、存储介质、程序产品与流程  >  正文

视频生成方法、装置、存储介质、程序产品与流程

  • 国知局
  • 2024-08-02 14:26:46

本公开涉及视频合成,尤其涉及一种视频生成方法、装置、存储介质、程序产品。

背景技术:

1、随着网络的普及,视频成为日常生活中重要的媒体传播方式,目前通常是用户自己撰写文本,然后查询与文本相关的图片、音乐等素材,最后将文本和素材剪辑为视频,这种由人工录制视频的方式不仅需要耗费用户的大量精力,而且录制视频的过程繁琐、效率较低。

技术实现思路

1、有鉴于此,本公开实施例提供了一种视频生成方法、装置、存储介质、程序产品,能够实现视频生成的自动化,节省人力成本,提高视频生成的效率。

2、第一方面,本公开实施例提供了一种视频生成方法,采用如下技术方案:

3、将目标文本划分为多个片段;

4、对多个所述片段进行情感分析,获得多个所述片段的情感;

5、按照预设规则将所述情感统一的片段重组,获得多个子文本;

6、为多个所述子文本匹配视频素材;

7、结合各所述视频素材和与之相匹配的子文本生成多个视频片段;

8、将多个所述视频片段拼接为目标视频。

9、可选地,所述按照预设规则将所述情感统一的片段重组,获得多个子文本,包括:

10、按照多个所述片段在所述目标文本中的位置顺序遍历多个所述片段;

11、若遍历的当前片段的情感与下一个片段的情感相同,则将所述当前片段与所述下一个片段整合,形成新的片段继续遍历;

12、若遍历的当前片段的情感与下一个片段的情感不相同,则将所述当前片段作为当前子文本。

13、可选地,所述为多个所述子文本匹配视频素材,包括:

14、遍历私人素材库中的第一素材,获取所述第一素材与所述子文本的第一相关度;

15、当所述第一相关度不小于第一阈值时,将所述第一素材作为所述子文本的视频素材;

16、当所述第一相关度小于第一阈值时,遍历系统素材库中的第二素材,获取所述第二素材与所述子文本的第二相关度;

17、当所述第二相关度不小于第二阈值时,将所述第二素材作为所述子文本的视频素材。

18、可选地,所述为多个所述子文本匹配视频素材,进一步包括:

19、当所述第二相关度小于第二阈值时,使用智能ai为所述子文本绘制视频素材。

20、可选地,所述结合各所述视频素材和与之相匹配的子文本生成多个视频片段,包括:

21、提取所述子文本的文字内容,按照预设的布局结构将所述文字内容和与之相匹配的所述视频素材整合为文本文档;

22、将所述文本文档转换为所述视频片段。

23、可选地,所述将所述文本文档转换为所述视频片段,包括:

24、将所述视频素材转换为视频帧;

25、基于所述文本文档的图文布局将所述文字内容转换为所述视频帧的字幕;

26、对所述文字内容进行语音合成转换,得到语音信息;

27、将所述视频帧、所述字幕和所述语音信息合成为所述视频片段。

28、可选地,所述对所述文字内容进行语音合成转换,得到语音信息,包括:

29、获取用户的录制声音;

30、基于所述录制声音训练得到音色模型;

31、使用所述音色模型对所述文字内容进行语音合成转换,得到语音信息。

32、第二方面,本公开实施例还提供了一种视频生成系统,采用如下技术方案:

33、目标文本划分模块,用于将目标文本划分为多个片段;

34、情感分析模块,用于对多个所述片段进行情感分析,获得多个所述片段的情感;

35、片段重组模块,用于按照预设规则将所述情感统一的片段重组,获得多个子文本;

36、视频素材匹配模块,用于为多个所述子文本匹配视频素材;

37、视频片段生成模块,用于结合各所述视频素材和与之相匹配的子文本生成多个视频片段;

38、视频片段拼接模块,用于将多个所述视频片段拼接为目标视频。

39、第三方面,本公开实施例还提供了一种计算机装置,采用如下技术方案:

40、所述计算机装置包括:

41、至少一个处理器;以及,

42、与所述至少一个处理器通信连接的存储器;其中,

43、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上任一所述的视频生成方法。

44、第四方面,本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行以上任一所述的视频生成方法。

45、第五方面,本公开实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现以上任一项所述方法的步骤。

46、本公开实施例提供的视频生成方法,将目标文本划分为多个片段,由于每个片段可能涉及不同的情感,因此通过情感分析和预设规则重组片段,生成多个子文本,该方式可以确保每个子文本其自身的整体情感一致,便于为子文本匹配更贴近观众的兴趣和情感需求的视频素材,视频素材可以丰富视频内容,使得最后生成的目标视频更具吸引力,增加了观众的观看欲望和满意度,而且为每个子文本匹配视频素材的过程可以同时进行,节省视频生成的整体时间。得到匹配的视频素材之后,基于视频素材生成并拼接视频片段,得到最终的目标视频,至此实现对文本转视频的自动化,节省人力成本,提高视频生成的效率。

47、上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。

技术特征:

1.一种视频生成方法,其特征在于,包括:

2.根据权利要求1所述的视频生成方法,其特征在于,所述按照预设规则将所述情感统一的片段重组,获得多个子文本,包括:

3.根据权利要求1所述的视频生成方法,其特征在于,所述为多个所述子文本匹配视频素材,包括:

4.根据权利要求3所述的视频生成方法,其特征在于,所述为多个所述子文本匹配视频素材,进一步包括:

5.根据权利要求1所述的视频生成方法,其特征在于,所述结合各所述视频素材和与之相匹配的子文本生成多个视频片段,包括:

6.根据权利要求5所述的视频生成方法,其特征在于,所述将所述文本文档转换为所述视频片段,包括:

7.根据权利要求6所述的视频生成方法,其特征在于,所述对所述文字内容进行语音合成转换,得到语音信息,包括:yy+242093p

8.一种计算机装置,其特征在于,所述计算机装置包括:

9.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行权利要求1-7任一所述的视频生成方法。

10.一种计算机程序产品,包括计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1~7任一项所述方法的步骤。

技术总结本公开实施例公开了一种视频生成方法、装置、存储介质、程序产品。其中,方法包括:将目标文本划分为多个片段;对多个所述片段进行情感分析,获得多个所述片段的情感;按照预设规则将所述情感统一的片段重组,获得多个子文本;为多个所述子文本匹配视频素材;结合各所述视频素材和与之相匹配的子文本生成多个视频片段;将多个所述视频片段拼接为目标视频。该方法能够自动化生成满足观众情感需求的视频,节省人力成本,提高视频生成的效率。技术研发人员:杜福娇,朱伟受保护的技术使用者:中广智媒(北京)科技有限公司技术研发日:技术公布日:2024/7/25

本文地址:https://www.jishuxx.com/zhuanli/20240801/242811.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。