技术新讯 > 控制调节装置的制造及其应用技术 > 一种分布式多路控制器系统及其实现方法与流程  >  正文

一种分布式多路控制器系统及其实现方法与流程

  • 国知局
  • 2024-08-01 00:05:38

本发明涉及通信系统,更具体地,涉及一种分布式多路控制器系统及其实现方法。

背景技术:

1、随着工业控制、信号处理和国防等领域对总线带宽、传输实时性要求的不断提高,传统的电信设备总线(versa module euro card,vme)、紧凑型pci(compact peripheralcomponent interconnect,cpci)等并行总线标准逐渐力不从心,vpx(verstatileprotocol switch bus)作为一种基于高速串行总线技术的标准已经悄然兴起。除了引入了目前最新串行总线技术以支持更高的背板带宽外,vpx还引入了智能平台管理接口(intelligent platform management interface,ipmi),用以监控系统的运行状态,提供系统的可靠性。

2、ipmi具体指的是不依赖操作系统对设备进行监控或者本地管理,甚至远程管理,自动监测和恢复平台管理的硬件和固件,管理的范畴比运行于操作系统的简单网络管理协议(simple network management protocol,snmp)软件要灵活很多。

3、ipmi具有恢复控制、监控、信息存储和保存日志等关键属性。平台管理功能在系统断电情况下或系统管理软件和常规的机制失效时,其依然有效,组件的状态可以通过ipmi被用户监测,预置阀值就不会被超出,这样不定期的断电就会被避免,it资源的运行时间得到了一定程度的协助维护。

4、一般地,系统管理软件或常规的管理软件对于实时集中管理大量分布式服务器或一体化设备环境的统一管理几乎很困难,ipmi控制器作为一种智能平台管理控制器,能够有效地管理集中大量分布式服务器,克服了传统系统管理方式的所受的局限性。在不同平台系统硬件上利用此接口标准设计实施系统管理,实现了不同平台的集中管理。

5、智能平台管理中的控制器(baseboard management controller,bmc)管理着整个分布式服务器或设备,是整个系统中可靠性最高的组件之一,需要在软硬件设计上注重其可靠性和可扩展性。在众多设计方案中,对控制器的设计均采用多通道物理模式的设计方法,使用控制器单元的物理冗余备份功能,提高其可靠性,但此方法限制了控制器单元的可扩展性。

6、为了实现多路控制器单元的冗余备份系统,最主要的问题是如何保证在任意时间点都能有一个控制器单元作为主控单元,并处于主导地位,还需避免多路控制器同时作为主控制器单元,与vpx模块功能板卡通信,从而造成命令和功能的紊乱。

7、故而亟需提出一种分布式多路控制器系统来解决所提出的问题。

技术实现思路

1、(一)要解决的技术问题

2、基于此,本发明提供了一种分布式多路控制器系统及其实现方法,提高分布式多路主控制器间的容错性、稳定性和可扩展性,并将其应用于分布式vpx设备中,提高分布式设备的整机性能与可靠性。

3、(二)技术方案

4、为解决上述技术问题,本发明提出了一种分布式多路控制器系统,其包括分布式多路控制器状态管理系统包括多路控制器冗余备份模块及多节点管理模块;其中,多路控制器单元用于挂载于两条ipmb总线上,多路控制器包括处于主控制单元的控制器及处于从控制单元的控制器,多路控制器冗余备份模块用于控制器的主、从控制单元工作状态的模式切换,多节点管理模块用于对系统中所有控制器对应的节点进行管理;

5、多路由节点通信管理系统包括多链路管理模块和连接各控制器之间的通信模块;其中,多链路管理模块用于对处于主控制单元工作状态的控制器的多样化链路接口任务信息进行统一管理,通信模块用于对不同控制器执行任务期间的消息进行传递;

6、冗余模式信息管理系统包括信息业务冗余竞争机制模块和组播心跳监测机制模块;其中,信息业务冗余竞争机制模块用于以主、从控制单元工作状态的切换方式将业务数据信息进行上报传输,组播心跳监测机制模块用于监测冗余控制器的工作状态。

7、本发明还提出了一种分布式多路控制器系统的实现方法,其特征在于,包括如下步骤:

8、步骤s110、设置多路控制器挂载于两条ipmb总线上,且在同一ipmb总线上的控制器处于同种控制单元工作状态模式;

9、步骤s120、设置多路控制器中各个控制器的初始工作状态;

10、步骤s130、启动心跳监测任务,获取多路控制器中各个控制器的当前工作状态。

11、在其中一个实施例中,所述步骤s120的方法,具体操作为:

12、获取多路控制器中各个控制器的槽位信息,多路控制器中各个控制器的初始工作状态为从控制单元工作状态,将控制器的槽位信息存储到存储模块中。

13、在其中一个实施例中,所述步骤s130的方法,包括如下步骤:

14、步骤s131、设置网络管理端口的连接方式;网络管理端口采用外部连接和内部连接两者方式,采用外部连接方式可将该网络管理端口连接到任何含有网络的外部设备中,采用内部连接方式可将该网络管理端口连接到内部vpx交换模块中;

15、步骤s132、根据网络管理端口是否处于连接状态来启动心跳监测任务,若网络管理端口处于连接状态,则转入执行步骤s133;否则,将该心跳监测任务挂起;

16、步骤s133、启动心跳监测任务,多路控制器间通过组播方式互发控制器id形式的心跳信息,根据多路控制器中控制器id大小来重新获取控制器的当前工作状态。

17、在其中一个实施例中,所述步骤s130之后,还包括

18、步骤s130-1、互发心跳信息,启动定时器,判断主备控制器之间在预设超时时间内是否接收到心跳信息;若是,则关闭定时器,判断对方控制器在线且网络正常;若否,则判断定时器时间是否在超过预设超时时间,若是,则判断对方控制器不在线或网络异常;若否,则继续互发心跳信息。

19、在其中一个实施例中,所述步骤s130-1之后,还包括

20、步骤s130-2、互发心跳信息,判断主备控制器之间在预设超时时间内是否接收到心跳信息;若是,则转入执行步骤s133;若否,判断主备控制器之间丢失数据包的次数是否大于预设次数,若是,则对控制器的当前工作状态进行更新,将控制器的当前工作状态设置为主控制单元工作状态;若否,则继续互发心跳信息。

21、在其中一个实施例中,所述步骤s130-2之后,还包括

22、步骤s130-3、若主备控制器之间心跳信息在通信时中断,并未在预设次数与预设超时时间内恢复通信,则将处于主控制单元工作状态的控制器更新为从控制单元,并通过ipmb总线向另一控制器发送复位指令;若再次重试连接信息或超时连接信息失败后,则不再发送复位指令,并向外上报另一控制器的故障信息。

23、在其中一个实施例中,所述步骤s130之后,还包括

24、步骤s140、根据步骤s130获取的处于主控制单元工作状态的控制器,该控制器采用udp模式通过网络管理端口进行信息上报操作。

25、在其中一个实施例中,所述步骤s140的方法,具体包括如下步骤:

26、步骤s141、若控制器为从控制单元工作状态,且心跳监测任务未中断,则将该信息上报任务挂起,不再进行信息上报操作,信息上报任务由处于主控单元工作状态的控制器进行上报;

27、步骤s142、若控制器为从控制单元工作状态,且心跳监测任务已中断,则其挂起心跳监测任务,等待该起心跳监测任务被唤醒,不再进行信息上报操作,信息上报任务由处于主控单元工作状态的控制器进行;

28、步骤s143、若控制器为主控单元工作状态,启动信息上报单元任务,由其进行信息上报操作。

29、在其中一个实施例中,所述步骤s130之前,还包括

30、步骤s150、多路控制器系统进行通讯时,多个链路和通讯由节点管理控制任务以队列方式统一控制和分配;

31、其中,所述步骤s160的方法,具体包括如下步骤:

32、步骤s161、创建节点管理控制任务,管理各链路节点的接收或发送信息功能任务;

33、步骤s162、各节点的功能任务依次根据步骤s161进行注册,形式统一的管理接口;

34、步骤s163、根据步骤s161,当有外部功能序列输入时,节点管理控制任务获取输入的功能序列,依据其序列号向各功能任务分配相应的任务;反之,若功能任务需要输出到外部序列时,则节点管理控制任务获取该功能任务,然后与外部设备进行通讯。

35、(三)有益效果

36、本发明与现有技术对比,本发明一种分布式多路控制器系统及其实现方法通过软、硬件结合的方式确定了多路控制器的控制单元的工作状态,保证了系统内部在任何时刻有且仅有一套系统控制器处于主控制器使用;配合采用组播心跳监控方式保证了主控制单元发生故障时,备用的从控制单元能够及时切换为新的主控制单元,从而解决了传统单路主控制器系统设计的缺陷,提高了分布式系统多路主控制器间的容错性、稳定性和可扩展性。

本文地址:https://www.jishuxx.com/zhuanli/20240730/199625.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。