技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音视频编辑方法、系统、装置及存储介质与流程 > 正文

音视频编辑方法、系统、装置及存储介质与流程

国知局
2024-06-21 11:44:01

本申请涉及音视频处理，尤其涉及一种音视频编辑方法、系统、电子装置及计算机可读存储介质。

背景技术：

1、音频和视频作为信息记载媒介，在用户的日常工作和生活中得到了广泛的应用。伴随着音视频的广泛应用，基于音视频的编辑需求也越发多样化。例如，对视频进行美化，包括添加滤镜和美化人脸等。

2、传统的音视频编辑软件需要用户通过鼠标、键盘等方式进行操作，操作过程繁琐且不直观。而且用户需要熟练掌握编辑软件的各种功能和操作指令，才能进行相应的操作，得到想要的编辑效果。对于没有音视频编辑基础的用户来说，操作体验并不友好。

技术实现思路

1、本申请的主要目的在于提出一种音视频编辑方法、系统、电子装置及计算机可读存储介质，旨在解决如何使用户更加方便快捷地进行音视频编辑的问题。

2、为实现上述目的，本申请实施例提供了一种音视频编辑方法，所述方法包括：

3、获取用户的音视频编辑需求；

4、根据所述编辑需求，通过预先训练的生成式大语言模型输出对应的编辑指令；

5、将所述编辑指令分发至对应的业务轨道进行处理，得到编辑结果。

6、可选地，所述获取用户的音视频编辑需求包括：

7、在前端页面提供语音输入接口，以供用户通过所述语音输入接口输入音视频编辑需求；

8、获取用户输入的语音数据；

9、将所述语音数据自动转换为对应的文本数据。

10、可选地，所述获取用户的音视频编辑需求还包括：

11、在前端页面提供文本输入接口，以供用户通过所述文本输入接口输入音视频编辑需求；

12、获取用户输入的文本描述。

13、可选地，所述根据所述编辑需求，通过预先训练的生成式大语言模型输出对应的编辑指令包括：

14、将所述编辑需求作为提示词输入所述生成式大语言模型，结合上下文生成所述提示词对应的编辑指令。

15、可选地，所述输出对应的编辑指令包括：

16、输出所述编辑需求对应的业务轨道及多层级细化指令。

17、可选地，所述将所述编辑指令分发至对应的业务轨道进行处理包括：

18、根据所述编辑指令封装对应的操作指令；

19、将封装后的所述操作指令分发至对应的业务轨道，以控制所述业务轨道执行所述操作指令，实现所述编辑需求。

20、可选地，所述根据所述编辑指令封装对应的操作指令包括：

21、将控制每个所述业务轨道完成所述编辑指令的多个调用方法封装为一个集合。

22、此外，为实现上述目的，本申请实施例还提供一种音视频编辑系统，所述系统包括：

23、获取模块，用于获取用户的音视频编辑需求；

24、生成模块，用于根据所述编辑需求，通过预先训练的生成式大语言模型输出对应的编辑指令；

25、分发模块，用于将所述编辑指令分发至对应的业务轨道进行处理，得到编辑结果。

26、为实现上述目的，本申请实施例还提供一种电子装置，所述电子装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音视频编辑程序，所述音视频编辑程序被所述处理器执行时实现如上述的音视频编辑方法。

27、为实现上述目的，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有音视频编辑程序，所述音视频编辑程序被处理器执行时实现如上述的音视频编辑方法。

28、本申请实施例提出的音视频编辑方法、系统、电子装置及计算机可读存储介质，能够结合自动语音识别服务和生成式大语言模型，根据用户输入的语音或文本描述识别音视频编辑需求，并自动根据所述编辑需求生成可操作的编辑指令，从而控制相应业务轨道执行所述编辑指令，实现所述编辑需求，使得用户能够更方便、快捷地进行音视频编辑操作，降低操作门槛，提升用户使用体验。

技术特征：

1.一种音视频编辑方法，其特征在于，所述方法包括：

2.根据权利要求1所述的音视频编辑方法，其特征在于，所述获取用户的音视频编辑需求包括：

3.根据权利要求1活2所述的音视频编辑方法，其特征在于，所述获取用户的音视频编辑需求还包括：

4.根据权利要求1所述的音视频编辑方法，其特征在于，所述根据所述编辑需求，通过预先训练的生成式大语言模型输出对应的编辑指令包括：

5.根据权利要求1或4所述的音视频编辑方法，其特征在于，所述输出对应的编辑指令包括：

6.根据权利要求1所述的音视频编辑方法，其特征在于，所述将所述编辑指令分发至对应的业务轨道进行处理包括：

7.根据权利要求5所述的音视频编辑方法，其特征在于，所述根据所述编辑指令封装对应的操作指令包括：

8.一种音视频编辑系统，其特征在于，所述系统包括：

9.一种电子装置，其特征在于，所述电子装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音视频编辑程序，所述音视频编辑程序被所述处理器执行时实现如权利要求1至7中任一项所述的音视频编辑方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有音视频编辑程序，所述音视频编辑程序被处理器执行时实现如权利要求1至7中任一项所述的音视频编辑方法。

技术总结本申请公开了一种音视频编辑方法，该方法包括：获取用户的音视频编辑需求；根据所述编辑需求，通过预先训练的生成式大语言模型输出对应的编辑指令；将所述编辑指令分发至对应的业务轨道进行处理，得到编辑结果。本申请还公开了一种音视频编辑系统、电子装置和计算机可读存储介质。由此，能够自动根据用户的编辑需求生成可操作的编辑指令，使得用户能够更方便、快捷地进行音视频编辑操作，降低操作门槛。技术研发人员：胡乾旭受保护的技术使用者：上海哔哩哔哩科技有限公司技术研发日：技术公布日：2024/4/17