技术新讯 > 电子通信装置的制造及其应用技术 > 一种基于文字时间轴的视频编辑方法及系统与流程 > 正文

一种基于文字时间轴的视频编辑方法及系统与流程

国知局
2024-08-02 14:55:45

本发明涉及视频处理，尤其涉及一种基于文字时间轴的视频编辑方法及系统。

背景技术：

1、当前视频剪辑技术主要面向专业人士和有经验的视频编辑人员，而对于非专业人士而言，视频剪辑仍然是一个具有挑战性和复杂性的任务。非专业人士通常缺乏视频剪辑技能和专业工具，导致他们在编辑和处理视频时面临困难。

2、传统的视频剪辑软件存在以下缺陷，限制了非专业人士在视频剪辑领域的参与和创作：

3、1.复杂的用户界面：传统视频剪辑软件通常具有复杂的用户界面，包含繁多的选项和工具栏，对于非专业人士来说难以理解和操作。这使得他们往往需要大量的时间和精力去学习软件的使用方法，限制了他们的创作和编辑效率。

4、2.技术要求高：许多视频剪辑软件对于硬件和系统要求较高，需要高性能的计算机和专业设备才能运行。这对于非专业人士而言是一个额外的负担，因为他们可能没有访问这样的设备或无法满足软件的技术要求。

5、3.缺乏智能化和自动化功能：传统视频剪辑软件通常缺乏智能化和自动化的功能，需要用户手动进行剪辑、裁剪、合并等操作。对于非专业人士而言，这些任务可能过于繁琐和复杂，限制了他们的创作能力和编辑效率。

6、因此，目前需要提出一种能够简化视频剪辑流程，提高剪辑效率的视频编辑方法。

技术实现思路

1、为解决上述问题，本发明提供了一种基于文字时间轴的视频编辑方法及系统，通过编辑文本即可编辑对应视频的方式，解决了现有剪辑软件操作复杂繁琐，上手难度高的问题。

2、为实现上述目的，本发明提供以下技术方案：

3、一种基于文字时间轴的视频编辑方法，包括以下步骤：

4、s1.获取视频数据，所述视频数据带有时间轴，提取所述视频数据中的音频数据；

5、s2.对音频数据进行语音转文字，得到带有时间轴的文本数据；

6、s3.根据时间轴将文本数据与视频数据进行对齐，响应于对文本数据的编辑，编辑对应时间轴上的视频数据；

7、s4.将编辑后的文本数据与视频数据进行合成，得到编辑完成的视频数据。

8、进一步地，在步骤s2中，在对音频数据进行语音转文字后，还包括对得到的文本数据进行文本修正。

9、进一步地，所述对得到的文本数据进行文本修正，其具体实现步骤为：

10、s21.根据视频内容选择内容标签，根据内容标签选择对应的语言模型；

11、s22.向所述语言模型输入符合内容标签的视频数据集，对语言模型进行训练，语言模型学习符合内容标签的视频数据集的语言特征，得到训练完成的语言模型；

12、s23.向训练完成的语言模型输入视频数据，再次进行语音转文字，得到修正后的文本数据。

13、进一步地，在步骤s3中，所述根据时间轴将文本数据与视频数据进行对齐，具体实现方式包括：将文本数据和视频数据在同一页面内分区进行显示，每帧视频数据与该帧视频内容对应文本关联。

14、进一步地，在步骤s3中，所述响应于对文本数据的编辑，编辑对应时间轴上的视频数据，具体实现方式包括：所述文本数据包括若干段文本，对任一一段文本进行修改，则根据字符串比较法计算该段文本修改前后的差异程度，当差异程度超过预设阈值时，将该段文本进行语音合成，将该段文本对应的音频数据替换为新的语音。

15、进一步地，所述将该段文本对应的音频数据替换为新的语音，其具体实现方式包括：当修改后的某段文本相较于修改前的文本增加的文字超过一定比例时，则对该段文本语音合成后得到的音频进行加速处理，使得处理后的音频与原音频数据长度相同。

16、进一步地，在步骤s3中，所述响应于对文本数据的编辑，编辑对应时间轴上的视频数据，具体实现方式还包括：删除任一一段文本数据，则删除对应的视频数据片段。

17、进一步地，还包括撤销指令，响应于撤销指令，将上一次所修改的视频数据和文本数据进行恢复。

18、进一步地，所述文本数据为srt格式。

19、通过上述技术方案，本发明具有以下有益效果：通过将视频中文本进行提取，并将文本与对应视频关联的方式，使得用户只需通过编辑文本即可对相应视频片段进行编辑，简化剪辑流程，降低了视频剪辑的门槛，提高了剪辑效率。

技术特征：

1.一种基于文字时间轴的视频编辑方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于文字时间轴的视频编辑方法，其特征在于，在步骤s2中，在对音频数据进行语音转文字后，还包括对得到的文本数据进行文本修正。

3.根据权利要求2所述的一种基于文字时间轴的视频编辑方法，其特征在于，所述对得到的文本数据进行文本修正，其具体实现步骤为：

4.根据权利要求3所述的一种基于文字时间轴的视频编辑方法，其特征在于，在步骤s3中，所述根据时间轴将文本数据与视频数据进行对齐，具体实现方式包括：将文本数据和视频数据在同一页面内分区进行显示，每帧视频数据与该帧视频内容对应文本关联。

5.根据权利要求4所述的一种基于文字时间轴的视频编辑方法，其特征在于，在步骤s3中，所述响应于对文本数据的编辑，编辑对应时间轴上的视频数据，具体实现方式包括：所述文本数据包括若干段文本，对任一一段文本进行修改，则根据字符串比较法计算该段文本修改前后的差异程度，当差异程度超过预设阈值时，将该段文本进行语音合成，将该段文本对应的音频数据替换为新的语音。

6.根据权利要求5所述的一种基于文字时间轴的视频编辑方法，其特征在于，所述将该段文本对应的音频数据替换为新的语音，其具体实现方式包括：当修改后的某段文本相较于修改前的文本增加的文字超过一定比例时，则对该段文本语音合成后得到的音频进行加速处理，使得处理后的音频与原音频数据长度相同。

7.根据权利要求4所述的一种基于文字时间轴的视频编辑方法，其特征在于，在步骤s3中，所述响应于对文本数据的编辑，编辑对应时间轴上的视频数据，具体实现方式还包括：删除任一一段文本数据，则删除对应的视频数据片段。

8.根据权利要求5-7中任一一项所述的一种基于文字时间轴的视频编辑方法，其特征在于，还包括撤销指令，响应于撤销指令，将上一次所修改的视频数据和文本数据进行恢复。

9.根据权利要求1所述的一种基于文字时间轴的视频编辑方法，其特征在于，所述文本数据为srt格式。

10.一种基于文字时间轴的视频编辑系统，其特征在于，包括：

技术总结本发明公开了一种基于文字时间轴的视频编辑方法及系统，包括以下步骤：获取视频数据，所述视频数据带有时间轴，提取所述视频数据中的音频数据；对音频数据进行语音转文字，得到带有时间轴的文本数据；根据时间轴将文本数据与视频数据进行对齐，响应于对文本数据的编辑，编辑对应时间轴上的视频数据；将编辑后的文本数据与视频数据进行合成，得到编辑完成的视频数据。本方法通过将文本与对应视频关联的方式，使得用户只需通过编辑文本即可对相应视频片段进行编辑，简化剪辑流程，降低了视频剪辑的门槛，提高了剪辑效率。技术研发人员：钟建辉,蔡文生,赵定金受保护的技术使用者：广东保伦电子股份有限公司技术研发日：技术公布日：2024/7/29