技术新讯 > 计算推算,计数设备的制造及其应用技术 > 大模型服务的部署方法、装置、介质及设备与流程  >  正文

大模型服务的部署方法、装置、介质及设备与流程

  • 国知局
  • 2024-11-21 12:05:20

本公开涉及人工智能,尤其涉及服务部署、深度学习、自然语言处理,具体涉及一种大模型服务的部署方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

背景技术:

1、人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

2、随着人工智能技术的快速发展,各行各业对大模型的需求日益增长,大模型的应用场景将越来越广泛。未来,随着技术的不断发展,大模型将会在更多的领域得到应用,为人类带来更多的便利和创新。

3、在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

1、本公开提供了一种大模型服务的部署方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

2、根据本公开的一方面,提供了一种大模型服务的部署方法,方法包括:响应于待配置的多个服务器中的第一服务器接收到来自客户端的配置请求,基于配置请求中有关第一服务器的配置信息,在第一服务器部署剧本编排模块;由剧本编排模块,根据预设的剧本文件以及配置请求中的配置描述,生成针对多个服务器的配置计划,其中,配置描述包括多个服务器的环境配置信息以及待安装软件的信息,待安装软件包括与大模型服务相关的软件,剧本文件包括具备依赖关系的多个预设任务,配置计划包括基于配置描述生成的与多个预设任务对应的多个配置任务;以及向多个服务器中的各个服务器按照配置计划依次分发对应的配置任务,使各个服务器逐步完成相应的环境配置和软件安装,以基于配置完成的多个服务器构建能够提供大模型服务的集群。

3、根据本公开的另一方面,提供了一种大模型服务的部署装置,装置包括:第一部署单元,被配置为响应于待配置的多个服务器中的第一服务器接收到来自客户端的配置请求,基于配置请求中有关第一服务器的配置信息,为第一服务器部署剧本编排模块;第一生成单元,被配置为由剧本编排模块,根据预设的剧本文件以及配置请求中的配置描述,生成针对多个服务器的配置计划,其中,配置描述包括多个服务器的环境配置信息以及待安装软件的信息,待安装软件包括与大模型服务相关的软件,剧本文件包括具备依赖关系的多个预设任务,配置计划包括基于配置描述生成的与多个预设任务对应的多个配置任务;以及第一分发单元,被配置为向多个服务器中的各个服务器按照配置计划依次分发对应的配置任务,使各个服务器逐步完成相应的环境配置和软件安装,以基于配置完成的多个服务器构建能够提供大模型服务的集群。

4、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开的大模型服务的部署方法。

5、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开的大模型服务的部署方法。

6、一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现本公开的大模型服务的部署方法。

7、根据本公开的一个或多个实施例,能够实现对集群高效地自动化构建,并使集群具备大模型服务能力,从而提升了大模型服务部署的便捷性。

8、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种大模型服务的部署方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述配置描述还包括所述多个服务器中每个服务器的角色,所述角色包括控制节点和计算节点,所述控制节点用于对所述计算节点进行管理和任务下达,并且其中,所述根据预设的剧本文件以及所述配置请求中的配置描述,生成针对所述多个服务器的配置计划包括:

3.根据权利要求2所述的方法,其中,所述集群中计算节点的数量被配置为多个,所述角色还包括负载均衡节点,所述负载均衡节点被配置用于执行下述操作:

4.根据权利要求3所述的方法,其中,所述集群被配置为包括多个控制节点,所述负载均衡节点还被配置用于执行下述操作:

5.根据权利要求1至4中任一项所述的方法,其中,所述集群中的各个计算节点还被配置有数据库,所述方法还包括:

6.根据权利要求5所述的方法,还包括:

7.根据权利要求6所述的方法,其中,所述集群中的各个计算节点被配置用于处理在线任务和离线任务,所述在线任务包括与大模型服务相关的任务,所述离线任务包括多模态数据处理任务和模型训练任务中的至少一者,并且,所述计算节点被配置为优先处理所述在线任务,并且其中,所述负载均衡节点还被配置用于执行下述操作:

8.一种大模型服务的部署装置,所述装置包括:

9.根据权利要求8所述的装置,其中,所述配置描述还包括所述多个服务器中每个服务器的角色,所述角色包括控制节点和计算节点,所述控制节点用于对所述计算节点进行管理和任务下达,并且其中,所述第一生成单元被进一步配置为:

10.根据权利要求9所述的装置,其中,所述集群中计算节点的数量被配置为多个,所述角色还包括负载均衡节点,所述负载均衡节点被配置用于执行下述操作:

11.根据权利要求10所述的装置,其中,所述集群被配置为包括多个控制节点,所述负载均衡节点还被配置用于执行下述操作:

12.根据权利要求8至11中任一项所述的装置,其中,所述集群中的各个计算节点还被配置有数据库,所述装置还包括:

13.根据权利要求12所述的装置,还包括:

14.根据权利要求13所述的装置,其中,所述集群中的各个计算节点被配置用于处理在线任务和离线任务,所述在线任务包括与大模型服务相关的任务,所述离线任务包括多模态数据处理任务和模型训练任务中的至少一者,并且,所述计算节点被配置为优先处理所述在线任务,并且其中,所述负载均衡节点还被配置用于执行下述操作:

15.一种电子设备,包括:

16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-7中任一项所述的方法。

17.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现权利要求1-7中任一项所述的方法。

技术总结本公开提供了一种大模型服务的部署方法、装置、介质及设备,涉及人工智能技术领域,尤其涉及服务部署、深度学习、自然语言处理技术领域。实现方案为:响应于待配置的多个服务器中的第一服务器接收到来自客户端的配置请求,基于配置请求中有关第一服务器的配置信息,在第一服务器部署剧本编排模块;由剧本编排模块,根据预设的剧本文件以及配置请求中的配置描述,生成针对多个服务器的配置计划;以及向多个服务器中的各个服务器按照配置计划依次分发对应的配置任务,使各个服务器逐步完成相应的环境配置和软件安装,以基于配置完成的多个服务器构建能够提供大模型服务的集群。技术研发人员:赵历,杨文涛,施星靓,罗航,李阳,索鹏受保护的技术使用者:昆仑芯(北京)科技有限公司技术研发日:技术公布日:2024/11/18

本文地址:https://www.jishuxx.com/zhuanli/20241120/334221.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。