一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于日志的故障根因分析方法、设备及存储介质与流程

2022-08-17 10:11:32 来源:中国专利 TAG:

技术特征:
1.一种基于日志的故障根因分析方法,包括:接收根因分析请求,所述根因分析请求中包含运维对象对应的日志数据以及为所述运维对象所指定的目标问题类型;在所述目标问题类型下预先打标出的日志事件中,查找与所述日志数据匹配的目标日志事件;按照所述目标问题类型下预置的根因定位逻辑,定位所述目标日志事件在所述根因定位逻辑中触发的约束条件所关联的故障根因;其中,所述根因定位逻辑中包含每个诊断环节中对其所关注日志事件的约束条件以及诊断环节之间的顺序。2.根据权利要求1所述的方法,所述在所述目标问题类型下预先打标出的日志事件中,查找与所述日志数据匹配的目标日志事件,包括:按照所述目标问题类型下预置的日志预处理逻辑,对所述日志数据进行预处理,以获得预处理后日志数据;针对所述预处理后日志数据中包含的每项日志文件,分别在所述目标问题类型下预先打标出的日志事件中查找是否存在匹配的日志事件;将所述目标问题类型下预先打标出的日志事件中因所述预处理后的日志数据而被命中的日志事件,作为所述目标日志事件。3.根据权利要求2所述的方法,所述目标问题类型下预先打标出的日志事件承载于所述目标问题类型专用的推理态drain解析树中,所述针对所述预处理后日志数据中包含的每项日志文件,分别在所述目标问题类型下预先打标出的日志事件中查找是否存在匹配的日志事件,包括:将所述预处理后日志数据中的每项日志文件分别带入所述目标问题类型专用的推理态drain解析树中,以搜索是否存在匹配的日志事件。4.根据权利要求2所述的方法,所述日志预处理逻辑包括扫描路径、日志行扫描顺序、日志过滤条件、是否需要补充/修正时间信息、是否需要增加指定字段或采样频率中的一种或多种。5.根据权利要求1所述的方法,还包括:在所述目标问题类型下,收集相关的日志样本;对所述日志样本进行聚类,以产生多个日志事件,所述日志事件作为描述聚类组中日志数据的模板;基于专家经验,在聚类出的多个日志事件中选择对所述目标问题类型下的根因定位结果存在影响的部分日志事件进行打标,以产生在所述目标问题类型下预先打标出的日志事件。6.根据权利要求5所述的方法,所述对所述日志样本进行聚类,以产生多个日志事件,包括:将所述日志样本输入所述目标问题类型专用的训练态drain解析树中,以产生多个日志事件,其中,所述打标出的日志事件也承载在所述训练态drain解析树中;所述方法还包括:从所述目标问题类型专用的训练态drain解析树中裁剪出所述打标出的日志事件所在的解析路径,以构建出所述目标问题类型专用的推理态drain解析树,在响应根因分析请求
的过程中使用所述推理态drain解析树查找与输入的日志数据匹配的日志事件。7.根据权利要求1所述的方法,所述按照所述目标问题类型下预置的根因定位逻辑,定位所述目标日志事件在所述根因定位逻辑中触发的约束条件所关联的故障根因,包括:按照所述根因定位逻辑中诊断环节之间的顺序,依次在各诊断环节下判断所述目标日志事件是否满足相应的约束条件;在约束条件已被所述目标日志事件所触发了的诊断环节下,分别输入各自关联的故障根因。8.根据权利要求7所述的方法,所述约束条件包括:存在指定日志事件、不存在指定日志事件、存在指定的多个日志事件中的任意一个或多个、同时存在指定的多个日志事件、指定日志事件出现后的指定时间内出现其它指定日志事件、或者指定的多个无序的日志事件均出现且相互间隔指定时间中的一种或多种条件组合。9.根据权利要求1所述的方法,还包括:若所述根因定位逻辑中的约束条件并未关联故障根因而是关联隐藏事件,则获取所述目标日志事件在所述根因定位逻辑中触发的约束条件所关联的隐藏事件,其中,所述隐藏事件是基于对应的约束条件中指定的日志事件所预测出的;将所述目标日志事件和所述隐藏事件作为根因分析模型的输入;在所述根因分析模型中提取所述目标日志事件和所述隐藏事件对应的事件特征,并基于事件特征与故障根因之间的映射关系,预测出所述故障根因。10.根据权利要求9所述的方法,还包括:从除日志外的其它途径获取与所述运维对象相关的参考事件;将所述参考事件也作为所述根因分析模型的输入并参与所述根据分析模型中的根因预测过程。11.根据权利要求1所述的方法,还包括:接收针对所述运维对象的日志事件识别请求;输出所述目标日志事件对应的打标信息,以响应所述日志事件识别请求;其中,所述打标信息包括事件描述信息、异常等级信息或事件所属的系统层级信息中的一种或多种。12.根据权利要求1所述的方法,所述运维对象包括边缘一体机或专有云中的软硬一体设备。13.一种计算设备,包括存储器、处理器和通信组件;所述存储器用于存储一条或多条计算机指令;所述处理器与所述存储器和所述通信组件耦合,用于执行所述一条或多条计算机指令,以用于:通过所述通信组件接收根因分析请求,所述根因分析请求中包含运维对象对应的日志数据以及为所述运维对象所指定的目标问题类型;在所述目标问题类型下预先打标出的日志事件中,查找与所述日志数据匹配的目标日志事件;按照所述目标问题类型下预置的根因定位逻辑,定位所述目标日志事件在所述根因定位逻辑中触发的约束条件所关联的故障根因;其中,所述根因定位逻辑中包含每个诊断环
节中对其所关注日志事件的约束条件以及诊断环节之间的顺序。14.一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行权利要求1-12任一项所述的基于日志的故障根因分析方法。

技术总结
本申请实施例提供一种基于日志的故障根因分析方法、设备及存储介质。在运维过程中可能遇到的各类问题下预先打标出日志事件并预置基于日志事件的根因定位逻辑,这样,可在各类问题下持续沉淀专家经验;在此基础上,在日常运维过程中,仅需提供运维对象对应的日志数据并为运维对象指定目标问题类型,即可自动化地识别运维对象所匹配的目标日志事件,并可将识别出的目标日志事件带入运维对象所适用的根因定位逻辑中,以及按照根因定位逻辑,定位出目标日志事件所触发的约束条件关联的故障根因。这可实现一键自动化根因分析,无需再依赖人工分析,有效提高根因分析效率。有效提高根因分析效率。有效提高根因分析效率。


技术研发人员:刘柳燕
受保护的技术使用者:阿里云计算有限公司
技术研发日:2022.04.28
技术公布日:2022/8/16
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献