技术新讯 > 电子通信装置的制造及其应用技术 > 设备管理方法和装置与流程  >  正文

设备管理方法和装置与流程

  • 国知局
  • 2024-10-21 14:57:55

本技术涉及云服务领域,并且更具体地,涉及一种设备管理方法和装置。

背景技术:

1、目前端边云协同的架构下,中心设备可以对边缘设备进行管理。但是中心设备和边缘设备之间的网络存在弱网断连的情况,断连后目前的系统要么出现边缘设备不再可管理,要么边缘设备仅能保持当前设备上正在运行的业务,支持有限的自治。

2、因此,如何在边云断连情况下令边缘设备仍然具备高级别的自治,即保持原先业务正常运行的同时可以进行新业务的部署与管理是目前亟需解决的技术问题。

技术实现思路

1、本技术实施例提供一种设备管理方法和装置,能够设置数据备份设备将管理设备的数据进行备份,在管理设备与边缘设备断连后,将数据备份设备升级为管理设备继续对边缘设备进行管理,从而保证在边云断连情况下边缘设备仍然具备高级别的自治。

2、第一方面,提供了一种设备管理方法,应用在设备管理系统中,所述设备管理系统包括第一设备、第二设备和至少一个第三设备,所述第一设备用于对所述第二设备和所述至少一个第三设备进行管理,所述第二设备包括所述第一设备的数据备份,所述方法由所述第二设备或者设置在所述第二设备中的设备管理装置执行,所述方法包括:确定所述第一设备状态异常;向所述至少一个第三设备发送第一报文,所述第一报文用于指示所述第二设备对所述至少一个第三设备进行管理。

3、本技术实施例提供的设备管理方法,第二设备能够备份第一设备的数据,在第一设备出现故障或者断连以后,第二设备可以升级为第一设备来代替第一设备对至少一个第三设备进行管理,从而保证在边云断连情况下边缘设备仍然具备高级别的自治。

4、应理解,边云指的是边缘设备和中心设备,中心设备可以对边缘设备进行管理。第一设备、第二设备和至少一个第三设备可以组成一个自治域,即所述设备管理系统,该自治域中,第一设备为指定节点(designated node,dn),即对自治域中的其他设备进行管理。第二设备为备份指定节点(backup designated node,bdn),用于对dn进行备份,第三设备为非dn/bdn的边缘节点(dn-other)。一个自治域中包括一个第一设备、一个第二设备和至少一个第三设备。应理解,本技术中节点与设备代表同一意思表达。

5、应理解,dn作为自治域中的管理设备,可以对自治域内的设备进行增改查删(create、update、read、delete,curd)。

6、示例性地,第一设备状态异常可以包括第一设备与其他设备的网络连接断开、第一设备出现故障导致不能对第二设备和第三设备进行管理等情况。

7、示例性地,第二设备向至少一个第三设备发送第一报文可以通过广播或者组播的方式,本技术对此不作限定。第一报文可以是hello报文,hello报文常用于发现直连链路上的邻居以及维护邻居关系。示例性地,可以用第一报文中第10-12字节代表本自治域中的dn,例如第二设备发送的第一报文的第10-12字节包括了第二设备的标识号(identitydocument,id),来通知接收到该第一报文的节点本自治域内的dn为第二设备,用于后续对第三设备进行管理。

8、可选的,也可以用第一报文中的一串比特位来指示第二设备为dn,例如“001000”中每一个比特位对应自治域中的一个设备,第三比特位与第二设备对应,该比特位为“1”代表本自治域内的dn为第二设备。该具体指示手段不应理解为对本技术的限制。

9、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:向所述至少一个第三设备发送第二报文,所述第二报文用于指示从所述至少一个第三设备中选举出第四设备,所述第四设备用于对所述第二设备的数据进行备份。

10、应理解,当第二设备升级为设备管理系统中的dn后,系统需要再选举出一个设备作为bdn,即选举出第四设备来对现在的dn,即第二设备的数据进行备份。

11、示例性地,第二报文可以是hello报文,用第二报文第16-20字节代表本自治域中的bdn,如第16-20字节可以保存本自治域内bdn的id,若不为空则表示本自治域已经有了bdn,若为空则表示本自治域还没有bdn。若第三设备收到的第二报文中第16-20字节为空,则代表需要进行bdn的选举,即需要选举出第四设备对第二设备的数据进行备份。可选的,也可以用第二报文中的一串比特位来指示选举第四设备,例如“000000”中每一个比特位对应自治域中的一个设备,该串比特位中的每一位都为“0”即代表本自治域内目前还没有bdn,需要进行bdn的选举,即需要选举出第四设备对第二设备的数据进行备份。

12、本技术实施例提供的设备管理方法,在第二设备升级为第一设备后可以指示系统重新选出新的数据备份设备,从而保障在第二设备出现故障后,系统中的其他边缘设备仍然具备高级别的自治。

13、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:将所述第二设备的数据同步给所述第四设备。

14、示例性地,第二设备可以将任务、应用、节点连接和/或资源的管理状态和数据同步给第四设备,可选的,可以采用批量同步和/或增量同步的方式。

15、本技术实施例提供的设备管理方法,第四设备可以对第二设备的数据进行备份,从而保障在第二设备出现故障后,第四设备可以升级为新的dn对系统中的其他边缘设备进行管理,保障其他边缘节点在原先的dn出现故障后仍然具备高级别的自治。

16、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:确定第一任务的状态异常,所述第一任务通过至少一个第五设备的至少一个应用执行,所述第五设备为所述第二设备或者所述至少一个第三设备中的任一个设备;将所述第一任务进行迁移或者重建。

17、应理解,dn可以管理系统中任务状态,并根据任务状态对异常任务在自治域内进行迁移或重建。示例性地,一个任务通过多个应用执行,该多个应用可以属于同一个设备,也可以属于多个设备。当任务状态异常时,dn可以将任务迁移到正常设备或者在正常设备上重建该任务。示例性地,dn可以在正常设备上启动对应的应用,并将任务对应的数据发送给该应用执行。

18、在一种可能的实现方式中,dn可以管理系统中应用状态,并根据应用状态对异常应用在自治域内进行迁移,使得任务不发生异常。示例性地,当一个应用状态异常时,dn可以将应用数据迁移到正常设备。例如dn可以在正常设备上启动对应的应用,并将应用对应的数据发送给该对应应用执行。

19、本技术实施例提供的设备管理方法,在设备管理系统中节点被删除或者节点故障的情况下,可快速进行业务迁移或者重建,保障业务的连续性。

20、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:接收来自于第六设备的第三报文,所述第六设备为所述第一设备或者所述至少一个第三设备中的任一个设备,所述第三报文用于指示所述第六设备与所述第二设备的网络连接情况;根据所述第三报文更新所述第二设备的网络连接状态。

21、示例性地,第三报文可以是hello报文。第三报文中的指定比特位可以用来代表第六设备与第二设备的网络连接情况,如未连接、已建立连接等情况。

22、在一些可能的实现方式中,第二设备的连接状态可以包括断开、初始化、连接等。

23、本技术实施例提供的设备管理方法,第二设备可以接收来自系统中其他设备的第三报文,实时感知本设备与其他设备的连接状态。

24、结合第一方面,在第一方面的某些实现方式中,所述根据所述第三报文更新所述第二设备的网络连接状态,包括:若所述第三报文指示所述第六设备与所述第二设备未建立连接,更新所述第二设备的网络连接状态为初始化状态;或若所述第三报文指示所述第六设备与所述第二设备已建立连接,更新所述第二设备的网络连接状态为连接状态。

25、示例性地,第三报文中代表第六设备与第二设备网络连接情况的指定比特位为空,代表第六设备与第二设备未建立连接,更新第二设备的网络连接状态为初始化状态。若第三报文中代表第六设备与第二设备网络连接情况的指定比特位包括了第二设备的id,代表第六设备与第二设备已建立连接,更新第二设备的网络连接状态为连接状态。可选的,也可以用第三报文中特定比特位为“0”或“1”来指示第六设备与第二设备的网络连接情况,本技术对具体指示手段不作限定。

26、本技术实施例提供的设备管理方法,第二设备可以接收来自系统中其他设备的第三报文,实时感知本设备与其他设备的连接状态。

27、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:根据所述第三报文更新所述第二设备的连接状态矩阵,所述连接状态矩阵包括所述第二设备与所述第六设备的网络连接信息。

28、应理解,系统中的每个设备都保存有连接状态矩阵用于表示本设备与设备管理系统中其他设备的网络连接信息。可选的,也可以用连接状态列表,比特串等形式表示本设备与设备管理系统中其他设备的网络连接信息。

29、示例性地,连接状态矩阵为一行n列,n列中n个元素对应系统中的n个设备。在第二设备的连接状态矩阵中,可以用0来代表该元素对应的设备未与第二设备建立连接,用1来代表该元素对应的设备已经与第二设备建立连接。

30、示例性地,第三报文中代表第六设备与第二设备网络连接情况的指定比特位包括了第二设备的id,代表第六设备与第二设备已建立连接,更新连接状态矩阵中与第六设备对应的元素为“1”。

31、本技术实施例提供的设备管理方法,第二设备可以接收来自系统中其他设备的第三报文,实时感知本设备与其他设备的连接状态。

32、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:确定所述第一设备恢复正常,所述第一设备为中心设备;将所述第二设备的数据同步给所述第一设备;向所述至少一个第三设备发送第四报文,所述第四报文用于指示所述第二设备不再对所述至少一个第三设备进行管理。

33、应理解,中心设备可以是服务器集群的中心,或者可以是云设备,用来对设备管理系统中的其他设备进行管理。当中心设备(第一设备)恢复正常后,第二设备需要将管理权转交给第一设备。

34、应理解,第二设备可以通过本地的连接状态矩阵、连接状态表或者比特串等信息来确定第一设备与第二设备已经建立连接,则认为第一设备已经恢复正常。

35、第一设备恢复与系统中其他设备的连接后可以成为系统中的bdn,第二设备可以将数据同步给第一设备,然后向系统中其他设备发送第四报文,表示不再对系统中其他设备进行管理,即清空第二设备的dn身份。示例性地,可以用第四报文中第10-12字节代表本自治域中的dn,若第四报文中第10-12字节为空,代表清空了第二设备的dn身份。

36、可选的,第二设备可以向系统中其他设备发送第四报文,表示第一设备成为新的dn。示例性地,可以用第四报文中第10-12字节代表本自治域中的dn,若第10-12字节包括了第一设备的id,则代表第一设备成为新的dn。

37、本技术实施例提供的设备管理方法,在边云断连恢复后,系统的业务/资源可以重新被中心设备管理,保障了中心设备的管理权。

38、结合第一方面,在第一方面的某些实现方式中,所述第一设备的优先级大于所述第二设备的优先级,且所述第一设备的优先级大于所述至少一个第三设备中任一个第三设备的优先级。

39、应理解,该优先级可以称为管理优先级或者备份优先级。设备的优先级可以与设备的地理位置、计算能力等因素有关,该优先级可以用户自主设置,也可以根据特定的规则生成。

40、本技术实施例提供的设备管理方法,将系统中的中心设备的优先级设置为最高,在断连恢复后中心设备可以迅速成为bdn,然后升级为dn,保障了中心设备的管理权。

41、结合第一方面,在第一方面的某些实现方式中,所述第二设备的优先级大于或者等于所述至少一个第三设备中任一个第三设备的优先级。

42、应理解,系统中的bdn可以是经过选举得到的。示例性地,报文第16-20字节代表了本自治域的bdn,若第二设备接收到的报文中对应第16-20字节为空,则将自己的id加入到第16-20字节然后发送报文给其他设备。若第二设备接收到的报文中第16-20字节的字节记录有其他设备的id,则对比本设备与第16-20字节记录的设备的优先级,若本设备的优先级高于第16-20字节记录的设备的优先级,则用本设备的id替换报文中第16-20字节记录的设备id,然后将报文发送给其他设备。经过一段时间的报文交换后,系统中优先级最高的非dn设备将成为本系统的bdn。应理解,dn不会参与bdn的选举。

43、本技术实施例提供的设备管理方法,可以选择优先级较高的设备作为系统中的bdn,保障了系统运行的稳定性。

44、结合第一方面,在第一方面的某些实现方式中,若第七设备的优先级等于所述第二设备的优先级,则所述第七设备的id值小于所述第二设备的id值,所述第七设备为所述至少一个第三设备中的任一个设备。

45、示例性地,报文第16-20字节代表了本自治域的bdn,若第二设备接收到的报文中第16-20字节的字节记录有其他设备的id,则对比本设备与第16-20字节记录的设备的优先级,若本设备的优先级等于第16-20字节记录的设备的优先级,则再比较本设备与第16-20字节记录的设备的id值,若本设备的id值大于该第16-20字节记录的设备的id值则用本设备的id替换报文中第16-20字节记录的设备id,然后将报文发送给其他设备。可选的,也可以在本设备的id值小于第16-20字节记录的设备id值的时候进行替换操作,该替换策略仅为示例,不应理解为对本技术的限制。

46、本技术实施例提供的设备管理方法,可以选择优先级较高和id值较大的设备作为系统中的bdn,保障了系统运行的稳定性。

47、第二方面,本技术实施例提供一种设备管理装置,该设备管理装置包括用于实现第一方面或第一方面的任一种可能的实现方式的单元。

48、第三方面,本技术实施例提供一种设备管理装置,该设备管理装置包括处理器,该处理器用于与存储器耦合,读取并执行该存储器中的指令和/或程序代码,以执行第一方面或第一方面的任一种可能的实现方式。

49、第四方面,提供了一种计算设备集群,包括至少一个计算设备,每个计算设备包括处理器和存储器;所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令,以使得所述计算设备集群执行第一方面或第一方面任意一种可能的实现方式中所述的方法。

50、可选地,该处理器可以是通用处理器,可以通过硬件来实现也可以通过软件来实现。当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于该处理器之外,独立存在。

51、第五方面,提供了一种包含指令的计算机程序产品,当所述指令被计算设备集群运行时,使得所述计算设备集群执行如上述第一方面以及第一方面的任意一种实现方式中的方法。

52、第六方面,提供了一种计算机可读存储介质,包括计算机程序指令,当所述计算机程序指令由计算设备集群执行时,所述计算设备集群执行如上述第一方面以及第一方面的任意一种实现方式中的方法。

53、作为示例,这些计算机可读存储包括但不限于如下的一个或者多个:只读存储器(read-only memory,rom)、可编程rom(programmable rom,prom)、可擦除的prom(erasableprom,eprom)、flash存储器、电eprom(electrically eprom,eeprom)以及硬盘驱动器(harddrive)。

54、可选地,作为一种实现方式,上述存储介质具体可以是非易失性存储介质。

本文地址:https://www.jishuxx.com/zhuanli/20241021/319965.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。