技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于大语言模型的数据处理方法、装置和电子设备与流程 > 正文

基于大语言模型的数据处理方法、装置和电子设备与流程

国知局
2024-11-18 18:15:58

本公开涉及人工智能，尤其涉及aigc(人工智能生成内容)、大语言模型、深度学习等，具体涉及一种基于大语言模型的数据处理方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

背景技术：

1、人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

2、大语言模型(large language model，llm，又称大型语言模型、大模型)是使用大量文本数据训练的深度学习模型，其可以实现自然语言文本的理解和生成。

3、在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

1、本公开提供了一种基于大语言模型的数据处理方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

2、根据本公开的一方面，提供了一种基于大语言模型的数据处理方法，包括：利用第一大语言模型确定用户的输入数据所包括的意图的复杂度；响应于所述复杂度指示所述输入数据仅包括一个意图，基于所述意图确定所述输入数据的回复数据；或者响应于所述复杂度指示所述输入数据包括多个意图：利用第二大语言模型确定所述输入数据对应的意图序列，其中，所述第二大语言模型的规模大于所述第一大语言模型的规模；以及基于所述意图序列，确定所述输入数据的回复数据。

3、根据本公开的一方面，提供了一种基于大语言模型的数据处理装置，包括：第一确定模块，被配置为利用第一大语言模型确定用户的输入数据所包括的意图的复杂度；第二确定模块，被配置为响应于所述复杂度指示所述输入数据仅包括一个意图，基于所述意图确定所述输入数据的回复数据；以及第三确定模块，被配置为响应于所述复杂度指示所述输入数据包括多个意图：利用第二大语言模型确定所述输入数据对应的意图序列，其中，所述第二大语言模型的规模大于所述第一大语言模型的规模；以及基于所述意图序列，确定所述输入数据的回复数据。

4、根据本公开的一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行上述方法。

5、根据本公开的一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使计算机执行上述方法。

6、根据本公开的一方面，提供了一种计算机程序产品，包括计算机程序指令，所述计算机程序指令在被处理器执行时实现上述方法。

7、根据本公开的一个或多个实施例，能够快速且准确地响应用户的需求。

8、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种基于大语言模型的数据处理方法，包括：

2.根据权利要求1所述的方法，其中，所述利用第一大语言模型确定用户的输入数据所包括的意图的复杂度包括：

3.根据权利要求1或2所述的方法，其中，所述基于所述意图确定所述输入数据的回复数据包括：

4.根据权利要求1-3中任一项所述的方法，其中，所述意图序列包括多个意图和所述多个意图之间的依赖关系，并且其中，所述基于所述意图序列，确定所述输入数据的回复数据包括：

5.根据权利要求3或4所述的方法，其中，所述生成所述输入数据的回复数据包括：

6.根据权利要求3-5中任一项所述的方法，还包括：

7.根据权利要求6所述的方法，其中，所述返回数据包括多媒体资源，所述方法还包括：

8.根据权利要求6所述的方法，其中，所述返回数据包括设备控制指令，所述方法还包括：

9.根据权利要求1-8中任一项所述的方法，还包括：

10.根据权利要求9所述的方法，其中，所述原始数据为所述用户的当前对话数据，并且其中，所述利用第三大语言模型对用户输入的原始数据进行纠错和指代消解包括：

11.一种基于大语言模型的数据处理装置，包括：

12.根据权利要求11所述的装置，其中，所述第一确定模块包括：

13.根据权利要求11或12所述的装置，其中，所述第二确定模块包括：

14.根据权利要求11-13中任一项所述的装置，其中，所述意图序列包括多个意图和所述多个意图之间的依赖关系，并且其中，所述第三确定模块包括：

15.根据权利要求13或14所述的装置，其中，所述第一生成单元或所述第二生成单元包括：

16.根据权利要求13-15中任一项所述的装置，还包括：

17.根据权利要求16所述的装置，其中，所述返回数据包括多媒体资源，所述装置还包括：

18.根据权利要求16所述的装置，其中，所述返回数据包括设备控制指令，所述装置还包括：

19.根据权利要求11-18中任一项所述的装置，还包括：

20.根据权利要求19所述的装置，其中，所述原始数据为所述用户的当前对话数据，并且其中，所述改写模块进一步被配置为：

21.一种电子设备，包括：

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使计算机执行根据权利要求1-10中任一项所述的方法。

23.一种计算机程序产品，包括计算机程序指令，其中，所述计算机程序指令在被处理器执行时实现权利要求1-10中任一项所述的方法。

技术总结本公开提供了一种基于大语言模型的数据处理方法、装置和电子设备，涉及人工智能技术领域，尤其涉及AIGC(人工智能生成内容)、大语言模型、深度学习等技术领域。基于大语言模型的数据处理方法包括：利用第一大语言模型确定用户的输入数据所包括的意图的复杂度；响应于复杂度指示输入数据仅包括一个意图，基于该意图确定输入数据的回复数据；或者，响应于复杂度指示输入数据包括多个意图：利用第二大语言模型确定输入数据对应的意图序列，第二大语言模型的规模大于第一大语言模型的规模；基于意图序列，确定输入数据的回复数据。技术研发人员：米雪,杨晨,宋超受保护的技术使用者：上海小度技术有限公司技术研发日：技术公布日：2024/11/14