技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种服务器故障预测方法及装置与流程  >  正文

一种服务器故障预测方法及装置与流程

  • 国知局
  • 2024-07-31 22:50:58

本申请涉及服务器监测,具体而言,涉及一种服务器故障预测方法及装置。

背景技术:

1、随着数据中心规模的持续增长,对数据中心的安全性和稳定性要求越来越高。机房作为一个重要的数据中心,其中存放的服务器若出现故障,往往会导致相关的业务运行出现问题,从而造成数据损坏以及经济损失等后果。

2、目前,现有技术通常是通过人工定期对服务器进行测试来监测服务器的故障情况。一方面,由于数据中心内存放的服务器的数量庞大,人工监测服务器的故障情况会消耗巨大的人力,增加服务器的维护成本。另一方面,由于无法做到预测服务器故障,因而很难在故障发生后及时发现并处理。

3、针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

1、本申请实施例提供了一种服务器故障预测方法及装置,以解决上述技术问题。

2、根据本申请实施例的一个方面,提供了一种服务器故障预测方法,包括:从服务器的故障数据库中获取进行预测之前的第一预设时间段内的历史故障记录;其中,上述故障数据库中存储有多条故障记录对应的第一时序数据,每条故障记录包括故障类型数据;获取在进行预测之前的第二预设时间段内上述服务器的运行状态对应的第二时序数据;其中,上述服务器的运行状态包括上述服务器的磁盘的运行状态、上述服务器的中央处理器的使用率、上述服务器上部署的数据库的读写状态以及上述服务器的响应时间;基于上述第一时序数据以及上述第二时序数据确定节点关联关系;其中,上述节点关联关系包括故障记录节点以及运行状态节点之间的相互关系,上述故障记录节点与上述运行状态节点均包括多个属性;上述运行状态节点的多个属性用于表示上述服务器的运行状态的多个特征;上述故障记录节点的多个属性用于表示上述多条故障记录的多个特征;根据上述节点关联关系构建包括上述故障记录节点以及上述运行状态节点的异构图;其中,上述异构图中,上述故障记录节点以及上述运行状态节点之间的各条边基于上述节点关联关系确定;基于上述服务器的图嵌入向量,对上述异构图中的上述故障记录节点和上述运行状态节点之间的各条边的权值进行更新;其中,上述服务器的图嵌入向量为根据第一图神经网络构建得到的;根据更新后的异构图对上述服务器的未来故障情况进行预测。

3、根据本申请实施例的另一方面,提供了一种服务器故障预测装置,包括:历史故障记录获取单元,用于从服务器的故障数据库中获取进行预测之前的第一预设时间段内的历史故障记录;其中,上述故障数据库中存储有多条故障记录对应的第一时序数据,每条故障记录包括故障类型数据;历史运行状态获取单元,用于获取在进行预测之前的第二预设时间段内上述服务器的运行状态对应的第二时序数据;其中,上述服务器的运行状态包括上述服务器的磁盘的运行状态、上述服务器的中央处理器的使用率、上述服务器上部署的数据库的读写状态以及上述服务器的响应时间;节点关联关系确定单元,用于基于上述第一时序数据以及上述第二时序数据确定节点关联关系;其中,上述节点关联关系包括故障记录节点以及运行状态节点之间的相互关系,上述故障记录节点与上述运行状态节点均包括多个属性;上述运行状态节点的多个属性用于表示上述服务器的运行状态的多个特征;上述故障记录节点的多个属性用于表示上述多条故障记录的多个特征;异构图构建单元,用于根据上述节点关联关系构建包括上述故障记录节点以及上述运行状态节点的异构图;其中,上述异构图中,上述故障记录节点以及上述运行状态节点之间的各条边基于上述节点关联关系确定;边权值更新单元,用于基于上述服务器的图嵌入向量,对上述异构图中的上述故障记录节点和上述运行状态节点之间的各条边的权值进行更新;其中,上述服务器的图嵌入向量为根据第一图神经网络构建得到的;故障预测单元,根据更新后的异构图对上述服务器的未来故障情况进行预测。

4、根据本申请实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的服务器故障预测方法。

5、基于本申请提供的服务器故障预测方法及装置,从服务器的故障数据库中获取进行预测之前的第一预设时间段内的历史故障记录;获取在进行预测之前的第二预设时间段内服务器的运行状态对应的第二时序数据;基于第一时序数据以及第二时序数据确定节点关联关系;根据节点关联关系构建包括故障记录节点以及运行状态节点的异构图;基于服务器的图嵌入向量,对异构图中的故障记录节点和运行状态节点之间的各条边的权值进行更新;根据更新后的异构图对服务器的未来故障情况进行预测。也就是说,通过对机房存放的服务器故障的预测,一方面,可以及时发现故障并解决故障,可以在一定程度上避免经济损失,降低数据损失的程度;另一方面,可以节约人力物力,节省服务器的维护成本,保证服务器运行的稳定性,进而可以保证相关业务运行的稳定性。

技术特征:

1.一种服务器故障预测方法,其特征在于,包括:

2.根据权利要求1所述的服务器故障预测方法,其特征在于,所述基于所述服务器的图嵌入向量,对所述异构图中的所述故障记录节点和所述运行状态节点之间的各条边的权值进行更新,包括:

3.根据权利要求2所述的服务器故障预测方法,其特征在于,所述根据更新后的异构图对所述服务器的未来故障情况进行预测,包括:

4.根据权利要求3所述的服务器故障预测方法,其特征在于,

5.根据权利要求1所述的服务器故障预测方法,其特征在于,所述第一图神经网络基于以下步骤建立:

6.根据权利要求1所述的服务器故障预测方法,其特征在于,所述服务器的响应时间基于以下步骤得到:

7.根据权利要求1所述的服务器故障预测方法,其特征在于,在获取服务器的故障数据库之前,所述方法还包括:

8.一种服务器故障预测装置,其特征在于,包括:

技术总结本发明公开了一种服务器故障预测方法及装置,涉及服务器监测技术领域。其中,该方法包括:从服务器的故障数据库中获取进行预测之前的第一预设时间段内的历史故障记录;获取在进行预测之前的第二预设时间段内服务器的运行状态对应的第二时序数据;基于第一时序数据以及第二时序数据确定节点关联关系;根据节点关联关系构建包括故障记录节点以及运行状态节点的异构图;基于服务器的图嵌入向量,对异构图中的故障记录节点和运行状态节点之间的各条边的权值进行更新;根据更新后的异构图对服务器的未来故障情况进行预测。本申请实现了对服务器的未来故障情况进行预测的技术效果。技术研发人员:王帅,曾治富,刘燚受保护的技术使用者:四川川西数据产业有限公司技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/194988.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。