一种租户管理方法、装置、控制器及存储介质与流程
- 国知局
- 2024-08-02 14:50:38
本技术涉及人工智能,特别是涉及一种租户管理方法、装置、控制器及存储介质。
背景技术:
1、随着人工智能(artificial intelligence,ai)技术的快速发展,各行各业对ai计算的算力需求日益增长,图形处理器(graphics processing unit,gpu)算力、参数网卡、存储网卡等算力资源单元租借成为一种迫切需求。对于使用基于融合以太网的远程直接内存访问(remote direct memory access over converged ethernet,roce)网络来提供算力服务的提供者来说,对算力资源支持租户划分成为急需解决的问题。
2、目前,用户通过访问控制列表(access control list,acl)规则进行流量控制,实现租户隔离。然而,设备的acl规格有限,这使得设备的acl规则无法支撑大规格租户的流量控制。此外,用户需要一一配置每个算力资源单元对应的acl规则,这使得acl规则配置也比较繁琐复杂。
技术实现思路
1、本技术实施例的目的在于提供一种租户管理方法、装置、控制器及存储介质,以实现对大规格租户的流量控制的支撑,简化租户隔离的规则配置。具体技术方案如下:
2、第一方面,本技术实施例提供了一种租户管理方法,应用于控制器,所述方法包括:
3、接收租户的资源申请请求,所述资源申请请求指示请求算力资源单元的数量为第一数量;
4、为所述租户分配所述第一数量个算力资源单元,所述第一数量个算力资源单元中至少两个算力资源单元连接的设备相同;
5、在所述第一数量个算力资源单元连接的每个设备对应的预设网络内,为所述租户创建所述第一数量个算力资源单元连通的可扩展虚拟局域网络(virtual extensiblelocal area network,vxlan)。
6、在一些实施例中,所述为所述租户分配所述第一数量个算力资源单元的步骤,包括:
7、从多个设备组中确定第一设备组,所述第一设备组连接的可用算力资源单元的数量大于等于所述第一数量;
8、将所述第一设备组连接的所述第一数量个可用算力资源单元分配给所述租户。
9、在一些实施例中,所述方法还包括:
10、从多个设备组中确定多个第二设备组,所述多个第二设备组连接的可用算力资源单元的数量大于等于所述第一数量;
11、将所述多个第二设备组连接的所述第一数量个可用算力资源单元分配给所述租户。
12、在一些实施例中,所述资源申请请求包括第一数量和请求主机的第二数量;所述第一设备组连接的第二数量个主机包括的可用算力资源单元的数量大于等于所述第一数量;
13、所述将所述第一设备组连接的所述第一数量个可用算力资源单元分配给所述租户的步骤,包括:
14、将所述第一设备组连接的第二数量个主机包括的所述第一数量个可用算力资源单元分配给所述租户。
15、在一些实施例中,所述为所述租户分配所述第一数量个算力资源单元的步骤,包括:
16、根据所述资源申请请求,确定所述第一数量对应的请求主机的第二数量;
17、从多个设备组中确定第三设备组,所述第三设备组连接的未被租户占用的可用主机数量大于等于第二数量,所述第二数量个可用主机包括所述第一数量个算力资源单元;
18、将所述第三设备组连接的所述第二数量个可用主机分配给所述租户。
19、在一些实施例中,所述方法还包括:
20、若所述多个设备组中不存在第三设备组,从多个设备组中确定多个第四设备组,所述多个第四设备组连接的未被租户占用的可用主机数量大于等于第二数量;
21、将所述多个第四设备组连接的所述第二数量个可用主机分配给所述租户。
22、在一些实施例中,所述方法还包括:
23、若所述多个设备组中不存在第三设备组,且不存在多个第四设备组,则从多个设备组中确定第一设备组,所述第一设备组连接的可用算力资源单元的数量大于等于所述第一数量;
24、将所述第一设备组连接的所述第一数量个可用算力资源单元分配给所述租户。
25、在一些实施例中,所述根据资源申请请求,确定所述第一数量对应的请求主机的第二数量的步骤,包括:
26、当所述资源申请请求包括所述第一数量时,计算所述第一数量与预设数量的除数,得到请求主机的第二数量,所述预设数量为预先设置的单个主机包括的算力资源单元数量;或,
27、当所述资源申请请求包括请求主机的第二数量时,从所述资源申请请求中提取所述第二数量,作为所述第一数量对应的请求主机的第二数量;或,
28、当所述资源申请请求包括请求主机的第二数量和目标主机类型时,从所述资源申请请求中提取所述第二数量,作为所述第一数量对应的请求主机的第二数量,并提取所述请求主机的目标主机类型;所述第三设备组连接的未被租户占用的目标主机类型的可用主机数量大于等于第二数量。
29、在一些实施例中,所述多个设备组包括的多个设备之间通过vxlan隧道连接;
30、所述在所述第一数量个算力资源单元连接的每个设备对应的预设网络内,为所述租户创建所述第一数量个算力资源单元连通的vxlan的步骤,包括:
31、在所述第一数量个算力资源单元连接的每个设备对应的预设网络内,为所述租户创建每个设备所属的vxlan、连通每个设备连接的算力资源单元的vxlan网关、以及连接每两个设备所属的vxlan的虚拟路由器,并配置所述第一数量个算力资源单元所属虚拟局域网(virtual local area network,vlan)vlan与vxlan的映射关系。
32、在一些实施例中,每个设备对应的vxlan网关的地址为该设备对应的预设网络的网段中的预设地址。
33、第二方面,本技术实施例提供了一种租户管理装置,应用于控制器,所述装置包括:
34、接收模块,用于接收租户的资源申请请求,所述资源申请请求指示请求算力资源单元的数量为第一数量;
35、分配模块,用于为所述租户分配所述第一数量个算力资源单元,所述第一数量个算力资源单元中至少两个算力资源单元连接的设备相同;
36、创建模块,用于在所述第一数量个算力资源单元连接的每个设备对应的预设网络内,为所述租户创建所述第一数量个算力资源单元连通的vxlan。
37、在一些实施例中,所述分配模块,具体用于:
38、从多个设备组中确定第一设备组,所述第一设备组连接的可用算力资源单元的数量大于等于所述第一数量;
39、将所述第一设备组连接的所述第一数量个可用算力资源单元分配给所述租户。
40、在一些实施例中,所述分配模块,还用于:
41、从多个设备组中确定多个第二设备组,所述多个第二设备组连接的可用算力资源单元的数量大于等于所述第一数量;
42、将所述多个第二设备组连接的所述第一数量个可用算力资源单元分配给所述租户。
43、在一些实施例中,所述资源申请请求包括第一数量和请求主机的第二数量;所述第一设备组连接的第二数量个主机包括的可用算力资源单元的数量大于等于所述第一数量;
44、所述分配模块,具体用于:
45、将所述第一设备组连接的第二数量个主机包括的所述第一数量个可用算力资源单元分配给所述租户。
46、在一些实施例中,所述分配模块,具体用于:
47、根据所述资源申请请求,确定所述第一数量对应的请求主机的第二数量;
48、从多个设备组中确定第三设备组,所述第三设备组连接的未被租户占用的可用主机数量大于等于第二数量,所述第二数量个可用主机包括所述第一数量个算力资源单元;
49、将所述第三设备组连接的所述第二数量个可用主机分配给所述租户。
50、在一些实施例中,所述分配模块,还用于:
51、若所述多个设备组中不存在第三设备组,从多个设备组中确定多个第四设备组,所述多个第四设备组连接的未被租户占用的可用主机数量大于等于第二数量;
52、将所述多个第四设备组连接的所述第二数量个可用主机分配给所述租户。
53、在一些实施例中,所述分配模块,还用于:
54、若所述多个设备组中不存在第三设备组,且不存在多个第四设备组,则从多个设备组中确定第一设备组,所述第一设备组连接的可用算力资源单元的数量大于等于所述第一数量;
55、将所述第一设备组连接的所述第一数量个可用算力资源单元分配给所述租户。
56、在一些实施例中,所述分配模块,具体用于:
57、当所述资源申请请求包括第一数量时,计算所述第一数量与预设数量的除数,得到请求主机的第二数量,所述预设数量为预先设置的单个主机包括的算力资源单元数量;或,
58、当所述资源申请请求包括请求主机的第二数量时,从所述资源申请请求中提取所述第二数量,作为所述第一数量对应的请求主机的第二数量;或,
59、当所述资源申请请求包括请求主机的第二数量和目标主机类型时,从所述资源申请请求中提取所述第二数量,作为所述第一数量对应的请求主机的第二数量,并提取所述请求主机的目标主机类型;所述第三设备组连接的未被租户占用的目标主机类型的可用主机数量大于等于第二数量。
60、在一些实施例中,所述多个设备组包括的多个设备之间通过vxlan隧道连接;
61、所述创建模块,具体用于:
62、在所述第一数量个算力资源单元连接的每个设备对应的预设网络内,为所述租户创建每个设备所属的vxlan、连通每个设备连接的算力资源单元的vxlan网关、以及连接每两个设备所属的vxlan的虚拟路由器,并配置所述第一数量个算力资源单元所属vlan与vxlan的映射关系。
63、在一些实施例中,每个设备对应的vxlan网关的地址为该设备对应的预设网络的网段中的预设地址。
64、第三方面,本技术实施例提供了一种控制器,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现上述第一方面所述的方法。
65、第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。
66、在本技术提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。
67、本技术实施例有益效果:
68、本技术实施例提供的技术方案中,预先为每个设备分别规划了一个网络,即该设备对应的预设网络。在租户申请资源时,控制器为该租户分配算力资源单元后,按照算力资源单元连接的设备对应的预设网络,为该租户创建算力资源单元连通的vxlan,避免了在该连通的vxlan外的算力资源单元与该连通的vxlan内的算力资源单元的互通,进而实现了租户隔离。此外,vxlan的数量达到了16m个,这使得本技术实施例提供的技术方案能够实现多达16m租户的标识能力,实现了对大规格租户的流量控制的支撑。
69、另外,本技术实施例中,预先规划了每个设备对应的网络,当至少两个算力资源单元连接的设备相同时,控制器只需要为这至少两个算力资源单元创建一次vxlan即可,而无需为每个算力资源单元分别创建vxlan,简化租户隔离的规则配置。
70、当然,实施本技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。
本文地址:https://www.jishuxx.com/zhuanli/20240801/244051.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表