异常事件定位方法、装置、电子设备及存储介质与流程
- 国知局
- 2024-09-11 14:21:51
本发明涉及计算机,涉及一种的异常事件定位方法、装置、电子设备及存储介质。
背景技术:
1、在互联网平台的日常开发和维护工作中,需实时监控平台中各种线上指标数据,当检测到任一指标数据出现异常时,例如,应用程序的崩溃次数过高或平台访问量骤降时,需收集对应的指标数据进行归因分析,以快速定位出指标数据出现异常的原因,进而针对异常原因进行优化或修复,以提升平台用户的平台使用体验,常规的方法是业务收到指标异动的告警时通过人工方式跟异动的指标相关的相关方都咨询一遍,确定操作异常的相关方并人工分析定位异常原因,不仅作业繁琐、费时,而且容易出错。
技术实现思路
1、鉴于以上内容,有必要提供一种的异常事件定位方法,其主要目的在于当检测到异常业务指标数据时,通过快速排查后验概率大的操作事件,从而提高定位异常事件的效率。
2、为实现上述目的,本发明提供一种异常事件定位方法,其特征在于,所述方法包括:
3、当检测到预设业务系统具有异常业务指标数据时,获取所述预设业务系统在预设时间内的第一操作事件集;
4、从预设数据库中获取第一操作事件集中每个操作事件的条件概率和先验概率,根据所述条件概率和先验概率依次计算所述第一操作事件集中每个操作事件的后验概率;
5、若有操作事件的后验概率大于或等于预设阈值,则生成对应操作事件的第一排查结果,并将该第一排查结果发送给预先确定的电子设备;
6、若有操作事件的后验概率小于预设阈值,则按照预设的排列顺序对所述第一操作事件集中所有后验概率小于预设阈值的操作事件进行筛查排序,并根据筛查排序结果生成第二排查结果,并将该第二次排查结果发送给预先确定的电子设备。
7、可选地,所述异常业务指标数据的检测,包括:
8、从预设数据库中获取历史业务指标数据的均值和方差;
9、根据所述历史业务指标数据的均值和方差计算出正常业务指标数据的标准业务值区间;
10、获取待检测业务指标数据的第一业务值,判断所述第一业务值是否处于所述标准业务值区间内;
11、若所述第一业务值不处于所述标准业务值区间内,则判断所述待检测业务指标数据为异常业务指标数据。
12、可选地,所述获取所述预设业务系统在预设时间内的第一操作事件集,包括:
13、判断所述异常业务指标数据为离线指标数据或实时指标数据;
14、若为离线指标数据,则获取所述预设业务系统在离线时间内发生的所有操作事件,作为所述第一操作事件集;
15、若为实时指标数据,则获取所述异常业务指标数据对应的时间点之前预设时间内发生的所有操作事件,作为所述第一操作事件集。
16、可选地,所述生成对应操作事件的第一排查结果,包括:
17、依次对所述第一操作事件集中后验概率大于或等于预设阈值的操作事件进行排查,并将排查结果存储至预设的消息队列中;
18、合并所述消息队列中所有操作事件的排查结果,得到所述第一排查结果。
19、可选地,所述第一操作事件集中每个操作事件对应的先验概率和条件概率,按照如下步骤得到:
20、获取所述预设系统的历史操作事件集和历史业务指标数据集;
21、根据所述历史业务指标数据集计算所述历史操作事件集中每个操作事件的先验概率和条件概率,并将计算的每个操作事件的先验概率和条件概率保存到所述预设数据库中,所述历史操作事件集包含第一操作事件集中的所有事件。
22、可选地,所述后验概率的计算公式为:
23、p(a,b)=p(b,a)*p(a)/p(b)
24、p(b)=p(b,a)*p(a)+p(b,a`)*p(a`)
25、其中,p(a,b)表示出现异常业务指标数据b时,第一操作事件a(所述第一操作事件是指第一操作事件集中的操作事件)发生的后验概率,p(a)指所述第一操作事件a发生的先验概率;p(a`)指所述第一操作事件a不发生的先验概率,p(b)指出现异常业务指标数据b的概率;p(b,a)指所述第一操作事件a发生的情况下,出现异常业务指标数据b的条件概率;p(b,a`)指所述第一操作事件a未发生的情况下,出现异常业务指标数据b的条件概率。
26、可选地,所述按照预设的排列顺序对所述操作事件进行筛查排序指按照后验概率的高低对所述操作事件进行筛查排序。
27、此外,为实现上述目的,本发明还提供一种异常事件定位装置,所述装置包括:
28、检测模块:用于当检测到预设业务系统具有异常业务指标数据时,获取所述预设业务系统在预设时间内的第一操作事件集;
29、计算模块:用于从预设数据库中获取第一操作事件集中每个操作事件的条件概率和先验概率,根据所述条件概率和先验概率依次计算所述第一操作事件集中每个操作事件的后验概率;
30、第一排查模块:用于若有操作事件的后验概率大于或等于预设阈值,则生成对应操作事件的第一排查结果,并将该第一排查结果发送给预先确定的电子设备;
31、第二排查模块:用于若有操作事件的后验概率小于预设阈值,则按照预设的排列顺序对所述第一操作事件集中所有后验概率小于预设阈值的操作事件进行筛查排序,并根据筛查排序结果生成第二排查结果,并将该第二次排查结果发送给预先确定的电子设备。
32、此外,为实现上述目的,本发明还提供一种电子设备,所述电子设备包括:
33、存储器,存储至少一个计算机程序;及
34、处理器,执行所述存储器中存储的程序以实现上述所述的异常事件定位方法。
35、此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的异常事件定位方法。
36、基于本发明提供的上述方案,当检测到预设业务系统具有异常业务指标数据时,获取所述预设业务系统出现异常业务指标数据的预设时间内发生的第一操作事件集,根据事先计算好并存储在预设数据库中所有操作事件的先验概率和条件概率,依次计算所述第一操作事件集中每个操作事件的后验概率,从而提高计算所有操作事件的后验概率的效率,若有操作事件的后验概率大于或等于预设阈值,则说明该操作事件是导致出现异常业务指标数据的概率较大,因此,优先对该操作事件进行排查;对后验概率小于预设阈值的操作事件,则按照预设的排列顺序对第一操作事件集中所有后验概率小于预设阈值的操作事件进行筛查排序,并根据筛查排序结果生成第二排查结果,本发明通过对后验概率较大的操作事件进行优先排查,后验概率较小的操作事件进行排序的方法,能够快速排查导致异常业务指标数据的原因,从而提高异常事件定位的效率。
技术特征:1.一种异常事件定位方法,其特征在于,所述方法包括:
2.如权利要求1所述的异常事件定位方法,其特征在于,所述异常业务指标数据的检测,包括:
3.如权利要求1所述的异常事件定位方法,其特征在于,所述获取所述预设业务系统在预设时间内的第一操作事件集,包括:
4.如权利要求1所述的异常事件定位方法,其特征在于,所述生成对应操作事件的第一排查结果,包括:
5.如权利要求4所述的异常事件定位方法,其特征在于,所述第一操作事件集中每个操作事件对应的先验概率和条件概率,按照如下步骤得到:
6.如权利要求1所述的异常事件定位方法,其特征在于,所述后验概率的计算公式为:
7.如权利要求1所述的异常事件定位方法,其特征在于,所述按照预设的排列顺序对所述操作事件进行筛查排序指按照后验概率的高低对所述操作事件进行筛查排序。
8.一种异常事件定位装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的异常事件定位方法。
技术总结本发明涉及计算机通信领域,当检测到预设业务系统具有异常业务指标数据时,获取所述预设业务系统在预设时间内的第一操作事件集,依次计算所述第一操作事件集中每个操作事件的后验概率,若有操作事件的后验概率大于或等于预设阈值,则生成对应该操作事件的第一排查结果;若有操作事件的后验概率小于预设阈值,则按照预设的排列顺序对所述操作事件进行筛查排序,并根据筛查排序结果生成第二排查结果。本发明按照后验概率的高低对操作事件进行排查,从而提高定位异常事件的效率和准确率。技术研发人员:陆勇,陈晓静,林昂基,赵雄洲,张航进受保护的技术使用者:深圳乐信软件技术有限公司技术研发日:技术公布日:2024/9/9本文地址:https://www.jishuxx.com/zhuanli/20240911/290400.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。