进程监控的方法及装置与流程
- 国知局
- 2024-10-21 15:11:51
本技术实施例涉及计算机领域,具体而言,涉及一种进程监控的方法及装置。
背景技术:
1、基本管理控制器(baseboard management controller,简称bmc)是一个独立于服务器系统的小型操作系统,主要用于服务器远程管理、监控、部署、重启等操作,对服务器的稳定运行有着重要的作用。
2、然而,随着服务器系统越来越复杂,监控的部件也各式各样,使得部件的通信接口也在逐渐升级换代,bmc的代码实现越来越复杂。当bmc长期运行时,就可能出现段内存泄漏、文件描述符、cpu占用率等问题,一旦出现这些问题,则会导致bmc停止对服务器的监控,从而导致服务器因为无法及时发现问题而宕机,进而影响服务器上的业务。
3、针对上述问题,目前尚未存在有效解决方案。
技术实现思路
1、本技术实施例提供了一种进程监控的方法及装置,以至少解决相关技术中无法监控bmc进程运行状态的问题。
2、根据本技术的一个实施例,提供了一种进程监控的方法,应用于基板管理控制器,包括:接收待监控进程集合中各个待监控进程的注册信息,其中,所述待监控进程的注册信息包括:所述待监控进程的身份标识、所述待监控进程的待监控类别,以及所述待监控类别的属性信息;按照多个预设的监控类别分别对所述待监控进程集合中各个待监控进程进行监控,其中,在当前的监控类别是多个预设的监控类中的目标监控类别的情况下,遍历所述待监控进程集合中的各个待监控进程,根据当前遍历的所述待监控进程的注册信息、所述目标监控类别对所述待监控进程集合中的各个所述待监控进程进行监控;将所述待监控进程集合中满足多个监控条件中至少一个监控条件的进程确定为目标进程,其中,所述多个预设的监控类别中的每个监控类别对应于一个监控条件。
3、在一个示例性实施例中,根据当前遍历的所述待监控进程的注册信息、所述目标监控类别对所述待监控进程集合中的各个所述待监控进程进行监控,包括:根据各个所述待监控进程的注册信息中的所述待监控类别,在所述待监控进程集合中确定所述待监控类别为所述目标监控类别的目标待监控进程,得到目标待监控进程集合,其中,所述目标监控进程集合中包括至少一个目标监控进程;对所述目标待监控进程集合中的第i个目标待监控进程执行以下操作,其中,i是大于或等于1的整数:遍历所述第i个目标待监控进程的指定路径下的各个进程状态信息,在当前遍历的进程状态信息是当前进程状态信息、且所述当前进程状态信息是与所述目标监控类别对应的进程状态信息的情况下,将所述当前进程状态信息确定为所述目标进程状态信息;根据各个所述目标待监控进程的所述目标进程状态信息、各个所述目标待监控进程的所述注册信息对所述目标待监控进程集合中的各个所述目标待监控进程的目标监控类别进行监控。
4、在一个示例性实施例中,根据各个所述目标待监控进程的所述目标进程状态信息、各个所述目标待监控进程的所述注册信息对所述目标待监控进程集合中的各个所述目标待监控进程的目标监控类别进行监控,包括:在所述第i个目标待监控进程的注册信息中获取所述目标监控类别的属性信息;根据所述目标监控类别的属性信息和/或所述目标进程状态信息对所述第i个目标待监控进程的目标监控类别进行监控。
5、在一个示例性实施例中,根据所述目标监控类别的属性信息和/或所述目标进程状态信息对所述第i个目标待监控进程的目标监控类别进行监控,包括:在所述目标监控类别为判断所述待监控进程是否在位的情况下,判断所述目标进程状态信息是否存在在位标识;在所述目标进程状态信息中不存在所述在位标识的情况下,确定所述第i个目标待监控进程满足第一监控条件,所述多个监控条件中包括所述第一监控条件。
6、在一个示例性实施例中,根据所述目标监控类别的属性信息和/或所述目标进程状态信息对所述第i个目标待监控进程的目标监控类别进行监控,包括:在所述目标监控类别为监控所述待监控进程的文件描述符数目的情况下,在所述第i个目标待监控进程的注册信息中获取描述符阈值,其中,所述目标监控类别的属性信息包括所述描述符阈值;在所述目标进程状态信息中所述第i个目标待监控进程的文件描述符数目大于或等于所述描述符阈值的情况下,确定所述第i个目标待监控进程满足第二监控条件,所述多个监控条件中包括所述第二监控条件。
7、在一个示例性实施例中,根据所述目标监控类别的属性信息和/或所述目标进程状态信息对所述第i个目标待监控进程的目标监控类别进行监控,包括:在所述目标监控类别为监控所述待监控进程的内存占用的情况下,在所述第i个目标待监控进程的注册信息中获取内存占用量阈值;在所述目标进程状态信息中所述第i个目标待监控进程的内存占用量大于或等于所述内存占用量阈值的情况下,确定所述第i个目标待监控进程满足第三监控条件,所述多个监控条件中包括所述第三监控条件。
8、在一个示例性实施例中,根据所述目标监控类别的属性信息和/或所述目标进程状态信息对所述第i个目标待监控进程的目标监控类别进行监控,包括:在所述目标监控类别为监控所述待监控进程的处理器使用率的情况下,在所述第i个目标待监控进程的注册信息获取处理器使用率阈值;在所述目标进程状态信息中所述第i个目标待监控进程的处理器使用率大于或等于所述处理器使用率阈值的情况下,确定所述第i个目标待监控进程满足第四监控条件,所述多个监控条件中包括所述第四监控条件。
9、在一个示例性实施例中,将所述待监控进程集合中满足多个监控条件中至少一个监控条件的进程确定为目标进程之后,所述方法还包括:对所述目标进程执行重启操作;和/或将所述目标进程的身份标识记录在目标日志。
10、根据本技术的另一个实施例,提供了一种进程监控的装置,包括:接收模块,用于接收待监控进程集合中各个待监控进程的注册信息,其中,所述待监控进程的注册信息包括:所述待监控进程的身份标识、所述待监控进程的待监控类别,以及所述待监控类别的属性信息;监控模块,用于按照多个预设的监控类别分别对所述待监控进程集合中各个待监控进程进行监控,其中,在当前的监控类别是多个预设的监控类中的目标监控类别的情况下,遍历所述待监控进程集合中的各个待监控进程,根据当前遍历的所述待监控进程的注册信息、所述目标监控类别对所述待监控进程集合中的各个所述待监控进程进行监控;确定模块,用于将所述待监控进程集合中满足多个监控条件中至少一个监控条件的进程确定为目标进程,其中,所述多个预设的监控类别中的每个监控类别对应于一个监控条件。
11、根据本技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
12、根据本技术的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
13、根据本技术的又一个实施例,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。
14、通过本技术,接收待监控进程集合中各个待监控进程的注册信息;按照多个预设的监控类别分别对待监控进程集合中各个待监控进程进行监控,其中,在当前的监控类别是多个预设的监控类中的目标监控类别的情况下,遍历待监控进程集合中的各个待监控进程,根据当前遍历的待监控进程的注册信息、目标监控类别对待监控进程集合中的各个待监控进程进行监控;将待监控进程集合中满足多个监控条件中至少一个监控条件的进程确定为目标进程。
15、由于将所需要监控的进程以及该进程所需要监控的类型注册给基本管理控制器,使得基本管理控制器可以根据注册信息对待监控进程进行对应的监控,实现对基板管理控制器进行的监控。因此,可以解决相关技术中无法监控bmc进程运行状态的问题,达到保证bmc持续稳定运行的效果。
本文地址:https://www.jishuxx.com/zhuanli/20241021/320821.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表