技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种故障注入方法、装置及相关设备与流程  >  正文

一种故障注入方法、装置及相关设备与流程

  • 国知局
  • 2024-07-31 22:48:19

本公开一般涉及电子信息,具体涉及数据库管理领域,尤其涉及一种故障注入方法、装置及电子设备、计算机可读存储介质、计算机程序产品。

背景技术:

1、随着分布式技术的快速发展,业务服务的架构和服务间调用关系的复杂成度呈爆炸式增长。从基础服务的故障到业务服务的故障频繁发生,一旦出现故障则会影响业务的正常开展。为了在故障未出现前就发现故障并主动进行修正,一般可以通过向系统内主动注入故障的方式,制造故障场景检验待验证服务是否产生异常情况,也称为混沌工程。通过主动引入故障,测试系统在各类下的行为,识别发现系统中存在的问题和风险并修复故障问题,还可以根据系统在各种压力下的行为表现确定优化策略,可以建立系统抵御线上运行风险的能力。

2、目前的混沌工程是通过主动修改主机的参数或者网络等参数向线上注入故障,破坏了线上环境,对业务有损,严重影响了系统的稳定性;并且验证的场景有限,无法对特有并复杂的业务场景做针对性的故障注入,故障场景有限,无法满足不同业务场景下特有的业务故障场景的需求,比如互联网金融。

3、因此,如何在避免对于线上服务环境的破坏的基础上实现故障注入,是本领域技术人员急需解决的问题。

技术实现思路

1、鉴于现有技术中的上述缺陷或不足,期望提供一种故障注入方法,以避免对于线上服务环境的破坏的基础上实现故障注入。

2、第一方面,本申请实施例提供了一种故障注入方法,包括:

3、接收故障模拟配置信息,提取配置参数;其中,所述配置参数包括报警策略;所述报警策略包括待监控服务和报警阈值;

4、获取所述待监控服务的信息,作为监控项信息;其中,所述监控项信息包括:日志路径、监控项采集的日志字段;

5、根据所述配置参数以及所述监控项信息,对所述监控项采集的日志字段进行可触发报警的故障日志构造,并生成故障日志的注入计划;

6、按所述注入计划向所述日志路径中写入所述故障日志,以便监控系统采集到所述故障日志后呈现对应的服务故障报警。

7、在一种实施例中,根据所述配置参数以及所述监控项信息,对所述监控项采集的日志字段进行可触发报警的故障日志构造,包括:

8、从所述配置参数中提取报警策略,获取报警规则;

9、解析所述报警规则获取待监控服务和报警阈值;

10、根据所述监控项信息从监控系统中获取所述待监控服务对应的日志样例和日志匹配规则;

11、根据所述报警阈值,构造可触发报警的所述监控项采集的日志字段,并根据所述日志匹配规则替换所述日志样例中对应的日志字段,作为故障日志。

12、在一种实施例中,在按所述注入计划向所述日志路径中写入所述故障日志之后,还包括:

13、当日志写入时间大于系统保护时间,且未检测到服务故障报警时,终止所述故障日志的写入。

14、在一种实施例中,在按所述注入计划向所述日志路径中写入所述故障日志之后,还包括:

15、在系统运行中,对指定指标进行异常监测;

16、若监测到出现异常,终止所述故障日志的写入。

17、在一种实施例中,所述指定指标包括:指定的系统业务核心指标,和/或,配置的检查列表中的指标。

18、在一种实施例中,在按所述注入计划向所述日志路径中写入所述故障日志之前,还包括:对所述故障日志添加故障模拟标记。

19、第二方面,本申请实施例提供了一种故障注入装置,包括:

20、故障配置提取模块,用于接收故障模拟配置信息,提取配置参数;其中,所述配置参数包括报警策略;所述报警策略包括待监控服务和报警阈值;

21、监控信息获取模块,用于获取所述待监控服务的信息,作为监控项信息;其中,所述监控项信息包括:日志路径、监控项采集的日志字段;

22、日志构造模块,用于根据所述配置参数以及所述监控项信息,对所述监控项采集的日志字段进行可触发报警的故障日志构造,并生成故障日志的注入计划;

23、日志注入模块,用于按所述注入计划向所述日志路径中写入所述故障日志,以便监控系统采集到所述故障日志后呈现对应的服务故障报警。

24、第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本申请实施例描述的方法。

25、第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例描述的方法。

26、第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如本申请实施例描述的方法。

27、本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

技术特征:

1.一种故障注入方法,其特征在于,包括:

2.如权利要求1所述的故障注入方法,其特征在于,根据所述配置参数以及所述监控项信息,对所述监控项采集的日志字段进行可触发报警的故障日志构造,包括:

3.如权利要求1所述的故障注入方法,其特征在于,在按所述注入计划向所述日志路径中写入所述故障日志之后,还包括:

4.如权利要求1所述的故障注入方法,其特征在于,在按所述注入计划向所述日志路径中写入所述故障日志之后,还包括:

5.如权利要求4所述的故障注入方法,其特征在于,所述指定指标包括:指定的系统业务核心指标,和/或,配置的检查列表中的指标。

6.如权利要求1所述的故障注入方法,其特征在于,在按所述注入计划向所述日志路径中写入所述故障日志之前,还包括:对所述故障日志添加故障模拟标记。

7.一种故障注入装置,其特征在于,包括:

8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要求1-6中任一所述的方法。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

技术总结本申请公开了一种故障注入方法、装置及电子设备、计算机可读存储介质、计算机程序产品,其中方法包括接收故障模拟配置信息,提取配置参数;获取所述待监控服务的信息,作为监控项信息;根据所述配置参数以及所述监控项信息,对所述监控项采集的日志字段进行可触发报警的故障日志构造,并生成故障日志的注入计划;按所述注入计划向所述日志路径中写入所述故障日志,以便监控系统采集到所述故障日志后呈现对应的服务故障报警。该方法可以避免对于线上服务环境的破坏的基础上实现故障注入。技术研发人员:闫彩凤,张伟建,胡东旭,陈存利受保护的技术使用者:度小满科技(北京)有限公司技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/194705.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。