一种基于网络告警关联的故障处理方法及系统与流程
- 国知局
- 2024-08-02 14:46:38
本技术涉及网络,尤其是涉及一种基于网络告警关联的故障处理方法及系统。
背景技术:
1、随着人工智能、物联网等网络技术的快速发展和广泛应用,数据网络系统中的各种硬件设备和软件系统每天都会产生大量的网络告警信息;在接收到网络告警信息后,维护人员需从大量的网络告警信息中逐一排查每个网络告警信息,以对网络告警信息的故障原因进行排查和采取故障处理措施。
2、而由于网络告警信息的数量庞大,且在进行网络告警信息的排查工作时、还需考虑一个网络告警信息是否会与其他的网络告警信息产生关联,因而对维护人员的网络故障排查工作造成干扰,加大了故障处理的难度;又因为人工在进行网络告警信息的排查故障工作时容易存在遗漏、且筛选效率较低,进一步延长了故障处理的时长,因而存在有网络告警的故障处理效率较低的缺陷,亟需进行改进。
技术实现思路
1、为了提高网络告警的故障处理效率,本技术提供一种基于网络告警关联的故障处理方法及系统。
2、第一方面,本技术的发明目的采用如下技术方案实现:
3、一种基于网络告警关联的故障处理方法,包括:
4、在预设时长内基于获取的若干个网络告警信息进行信息识别得到告警信息数据,每个所述网络告警信息关联告警识别标识;
5、对所述告警信息数据进行数据预处理得到若干个不同的目标告警信息;将所述不同的目标告警信息发送至预设的告警关联判断模型,以根据所述告警识别标识获取不同的目标告警信息对应的关联判断信息;
6、基于所述关联判断信息、对所述不同的目标告警信息进行故障识别判定以得到对应的业务中断判定结果;
7、基于若干个不同的目标告警信息、关联判断信息和对应的业务中断判定结果生成若干个故障处理工单,并依据预设的故障派单规则将所述若干个故障处理工单发送至对应的维修用户终端。
8、通过采用上述技术方案,在指定的时间段内,获取网络通信系统(即输出网络告警信息的网络系统)的若干个网络告警信息,由于网络告警信息会存在重复推送、网络告警信息繁杂、存在无效告警等的情况,且针对物联网的网络系统中的多种类型的设备的网络告警信息需要根据实际的设备类型进行区分后再进行故障判定,以提高对网络告警信息的故障判定效率;因而需要对获取的若干个网络告警信息进行信息识别提取,以初步筛出网络告警信息无效的网络告警信息,得到告警信息数据,针对每个网络告警信息关联有告警识别标识,告警识别标识用于表征网络告警信息的内容和设备类型信息;接着对若干个告警信息数据进行数据处理:如数据去重、过滤等的数据预处理以得到目标告警信息,有利于减少告警关联判断模型的计算量。
9、进一步地,为建立和获取若干个目标告警信息的关联关系,将若干个目标告警信息发送至告警关联判断模型,告警关联判断模型对若干个目标告警信息的关联关系进行故障判定后输出对应的业务中断判定结果,业务中断判定结果用于表征该目标告警信息的故障严重程度以及是否会对当前的网络系统造成业务中断;然后再基于若干个不同的目标告警信息、业务中断判定结果等信息生成故障处理工单后,再进行派单至对应的维修用户终端,维修用户终端连接具备相应维修专业技能的维修人员,操作较便捷,且整体上提高了网络告警的故障处理效率。
10、本技术在一较佳示例中:所述网络告警信息由至少一个目标网络设备的网元生成;所述基于所述关联判断信息、对所述不同的目标告警信息进行故障识别判定以得到对应的业务中断判定结果之后,包括:
11、获取各个目标网络设备的网元关系树,所述网元关系树根据目标网络设备上的各个网元的从属关系生成;所述网元关系树包括根节点和多级叶节点;根节点表示该目标网络设备,每级叶节点表示该目标网络设备上的网元,每级叶节点从属于其相连的上一级叶节点;
12、在获取的网元关系树中,将目标告警信息与对应的根节点或叶节点进行关联,形成各目标网络设备的告警信息树;
13、获取业务系统拓扑图,所述业务系统拓扑图包括多个业务节点和各个业务节点之间的关联关系;
14、基于所述业务系统拓扑图得到各目标网络设备的业务拓扑关系;基于预设的节点匹配规则和不同目标告警信息对应的业务中断判定结果,将各目标网络设备的告警信息树进行连接,以形成可视化的业务判定故障图。
15、通过采用上述技术方案,网元关系树表征了该目标网络设备上的各个网元的从属关系,以便于通过该目标网络设备的网元关系树了解各个目标网络设备上的网元数量、各个网元之间的从属关系,有利于后续在某一个目标网络设备出现故障时,计算故障的影响范围和各个网元故障之间存在的因果关系。
16、具体的,在获取的网元关系树中,每级叶节点代表的网元从属于其相连的上一级的叶节点表征的网元,例如,目标网络设备包括机箱、板卡,板卡包括物理接口、通讯接口和逻辑接口等,将目标告警信息与网元关系树进行关联,以形成具体显示告警信息的网元位置的告警信息树,便于将多个目标告警信息进行关联显示;接着再获取多个目标网络设备的业务系统拓扑图,以获取业务节点的数量和各个业务节点之间的关联关系,从而便于基于业务系统拓扑图中的各个目标网络设备的业务拓扑关系进行业务节点匹配,为便于查阅和分析多个目标告警信息中的业务中断结果,将各个目标网络设备的告警信息树进行连接,以形成对应多个目标告警信息的业务中断判定结果的业务判定故障图,通过业务判定故障图可快速获取各个目标网络设备的业务中断判定结果和目标告警信息。
17、本技术在一较佳示例中:所述关联判断信息包括关联告警信息;所述基于所述关联判断信息、对所述不同的目标告警信息进行故障识别判定以得到对应的业务中断判定结果,具体包括:
18、基于所述关联判断信息计算对应的目标告警信息发生的概率,以得到告警概率;
19、在所述告警概率大于或等于预设的概率阈值时,预设的告警信息数据库根据对应的目标告警信息得到第一业务中断判定结果;
20、在所述告警概率小于预设的概率阈值时,则计算对应的目标告警信息的业务中断概率,并根据所述业务中断概率的数值得到该目标告警信息的第二业务中断判定结果;
21、将所述第一业务中断判定结果或第二业务中断判定结果作为目标告警信息对应的业务中断判定结果。
22、通过采用上述技术方案,告警信息数据库中储存有基于不同的目标告警信息是否会导致业务中断的历史目标告警信息、以及对应的业务中断判定概率;对于告警概率较高的目标告警信息,为便于判定其业务中断概率,直接将告警概率大于、等于概率阈值的目标告警信息与告警信息数据库中的历史目标告警信息进行比对,并输出第一业务中断判定结果;对于告警概率小于概率阈值的目标告警信息,则进一步计算对应的业务中断概率,根据业务中断概率的数值输出目标告警信息的第二业务中断判定结果,从而便于对目标网络设备的多个网元的目标告警信息进行故障判定,有利于提高网络故障判定的计算判定效率。
23、本技术在一较佳示例中:所述业务中断判定结果包括业务中断故障;所述基于预设的节点匹配规则和不同目标告警信息对应的业务中断判定结果,将各目标网络设备的告警信息树进行连接,以形成可视化的业务判定故障图之后,还包括:
24、在获取到业务中断故障的业务中断判定结果时,确定与该业务中断故障的目标告警信息为故障告警信息;在所述可视化的业务判定故障图中识别并获取与该故障告警信息具有因果关系的若干个目标告警信息;
25、依据故障告警信息和对应具有因果关系的若干个目标告警信息的业务内容,列出对应的业务工作内容;根据对应的业务工作内容确定业务流程和业务关联关系,制定生成初步业务工作模型;
26、将所述可视化的业务判定故障图与初步业务工作模型关联生成可视化的业务中断情景模拟模型。
27、通过采用上述技术方案,为便于对网络通信系统的业务中断故障进行可视化情景模拟,并智能诊断出发生故障根因的故障告警信息和受故障告警信息影响而产生的网络告警信息;需要诊断分析出故障告警信息在发生故障时,对其他网元或目标网络设备的故障告警信息之间的因果关联信息,以便于维护人员在进行故障维护工作时,对于某一个故障点在预设时长对应的时间戳范围或预设的设备区域范围内进行故障排查;初步业务工作模型用于指示若干个目标网络设备和对应网元之间的业务工作节点之间的业务关联内容:如业务因果关系和业务从属关系,根据初步业务工作模型可获取若干个目标告警信息是否存在故障业务关联,以便于将业务判定故障图与初步业务工作模型进行业务关联,得到包括业务关联信息、业务流程信息和故障因果信息的可视化的业务中断情景模拟模型,便于维修人员进行故障维护、故障原因分析,且快速超出目标告警信息中的根源故障信息。
28、本技术在一较佳示例中:所述对所述告警信息数据进行数据预处理得到若干个不同的目标告警信息,具体包括:
29、通过相似度算法计算若干个所述告警信息数据之间的相似度,得到各个网络告警信息的相似度数据组;
30、将所述相似度数据高于预设的相似度阈值的告警信息数据、对应的网络告警信息过滤;
31、依序对在预设时长内的告警信息数据进行格式标准化清洗、明显逻辑错误清洗、非需求数据清洗和关键信息缺失清洗的数据预处理,以得到若干个不同的目标告警信息。
32、通过采用上述技术方案,对于在同一指定的时间段内接收到的重复的告警信息数据,为便于减少数据处理的计算量,先基于相似度算法找出相似度相同或很高的网络告警信息,以得到对应的各个网络告警信息的相似度数据组,将相似度相同的两个以上的网络告警信息进行去重处理,接着再依序对去重处理后的多个告警信息数据进行格式标准化、明显逻辑错误、非需求数据和关键信息缺失等数据清洗工作,以便于从大量繁杂的网络告警信息中筛出比较有价值和可能造成业务中断的网络告警信息,便于对网络告警信息进行故障分析和处理。
33、第二方面,本技术的发明目的采用如下技术方案实现:
34、一种基于网络告警关联的故障处理系统,包括:用于执行如上所述的一种基于网络告警关联的故障处理方法,系统包括:
35、告警信息获取模块,用于在预设时长内基于获取的若干个网络告警信息进行信息识别得到告警信息数据,每个所述网络告警信息关联告警识别标识;
36、关联判断匹配模块,用于对所述告警信息数据进行数据预处理得到若干个不同的目标告警信息;将所述不同的目标告警信息发送至预设的告警关联判断模型,以根据所述告警识别标识获取不同的目标告警信息对应的关联判断信息;
37、故障识别判定模块,用于基于所述关联判断信息、对所述不同的目标告警信息进行故障识别判定以得到对应的业务中断判定结果;
38、故障工单派单模块,用于基于若干个不同的目标告警信息、关联判断信息和对应的业务中断判定结果生成若干个故障处理工单,并依据预设的故障派单规则将所述若干个故障处理工单发送至对应的维修用户终端。
39、通过采用上述技术方案,对获取的若干个网络告警信息进行信息识别提取,以初步筛出网络告警信息无效的网络告警信息,得到告警信息数据,针对每个网络告警信息关联有告警识别标识,告警识别标识用于表征网络告警信息的内容和设备类型信息;接着对若干个告警信息数据进行数据处理:如数据去重、过滤等的数据预处理以得到目标告警信息,有利于减少告警关联判断模型的计算量。
40、进一步地,为建立和获取若干个目标告警信息的关联关系,将若干个目标告警信息发送至告警关联判断模型,告警关联判断模型对若干个目标告警信息的关联关系进行故障判定后输出对应的业务中断判定结果,业务中断判定结果用于表征该目标告警信息的故障严重程度以及是否会对当前的网络系统造成业务中断;然后再基于若干个不同的目标告警信息、业务中断判定结果等信息生成故障处理工单后,再进行派单至对应的维修用户终端,维修用户终端连接具备相应维修专业技能的维修人员,操作较便捷,且整体上提高了网络告警的故障处理效率。
41、本技术在一较佳示例中:所述故障识别判定模块包括:
42、告警概率计算子模块,用于基于所述关联判断信息计算对应的目标告警信息发生的概率,以得到告警概率;
43、第一中断判定子模块,用于在所述告警概率大于或等于预设的概率阈值时,预设的告警信息数据库根据对应的目标告警信息得到第一业务中断判定结果;
44、第二中断判定子模块,用于在所述告警概率小于预设的概率阈值时,则计算对应的目标告警信息的业务中断概率,并根据所述业务中断概率的数值得到该目标告警信息的第二业务中断判定结果;
45、结果输出子模块,用于将所述第一业务中断判定结果或第二业务中断判定结果作为目标告警信息对应的业务中断判定结果。
46、通过采用上述技术方案,告警信息数据库中储存有基于不同的目标告警信息是否会导致业务中断的历史目标告警信息、以及对应的业务中断判定概率;对于告警概率较高的目标告警信息,为便于判定其业务中断概率,直接将告警概率大于、等于概率阈值的目标告警信息与告警信息数据库中的历史目标告警信息进行比对,并输出第一业务中断判定结果;对于告警概率小于概率阈值的目标告警信息,则进一步计算对应的业务中断概率,根据业务中断概率的数值输出目标告警信息的第二业务中断判定结果,从而便于对目标网络设备的多个网元的目标告警信息进行故障判定,有利于提高网络故障判定的计算判定效率。
47、本技术在一较佳示例中:所述关联判断匹配模块包括:
48、相似度计算子模块,用于通过相似度算法计算若干个所述告警信息数据之间的相似度,得到各个网络告警信息的相似度数据组;
49、告警信息过滤子模块,用于将所述相似度数据高于预设的相似度阈值的告警信息数据、对应的网络告警信息过滤;
50、数据清洗子模块,用于依序对在预设时长内的告警信息数据进行格式标准化清洗、明显逻辑错误清洗、非需求数据清洗和关键信息缺失清洗的数据预处理,以得到若干个不同的目标告警信息。
51、通过采用上述技术方案,对于在同一指定的时间段内接收到的重复的告警信息数据,为便于减少数据处理的计算量,先基于相似度算法找出相似度相同或很高的网络告警信息,以得到对应的各个网络告警信息的相似度数据组,将相似度相同的两个以上的网络告警信息进行去重处理,接着再依序对去重处理后的多个告警信息数据进行格式标准化、明显逻辑错误、非需求数据和关键信息缺失等数据清洗工作,以便于从大量繁杂的网络告警信息中筛出比较有价值和可能造成业务中断的网络告警信息,便于对网络告警信息进行故障分析和处理。
52、第三方面,本技术的发明目的采用如下技术方案实现:
53、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种基于网络告警关联的故障处理方法的步骤。
54、第四方面,本技术的发明目的采用如下技术方案实现:
55、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于网络告警关联的故障处理方法的步骤。
56、综上所述,本技术包括以下至少一种有益技术效果:
57、1. 对获取的若干个网络告警信息进行信息识别提取,以初步筛出网络告警信息无效的网络告警信息,得到告警信息数据,针对每个网络告警信息关联有告警识别标识,告警识别标识用于表征网络告警信息的内容和设备类型信息;接着对若干个告警信息数据进行数据处理:如数据去重、过滤等的数据预处理以得到目标告警信息,有利于减少告警关联判断模型的计算量;进一步地,为建立和获取若干个目标告警信息的关联关系,将若干个目标告警信息发送至告警关联判断模型,告警关联判断模型对若干个目标告警信息的关联关系进行故障判定后输出对应的业务中断判定结果,业务中断判定结果用于表征该目标告警信息的故障严重程度以及是否会对当前的网络系统造成业务中断;然后再基于若干个不同的目标告警信息、业务中断判定结果等信息生成故障处理工单后,再进行派单至对应的维修用户终端,维修用户终端连接具备相应维修专业技能的维修人员,操作较便捷,且整体上提高了网络告警的故障处理效率;
58、2. 告警信息数据库中储存有基于不同的目标告警信息是否会导致业务中断的历史目标告警信息、以及对应的业务中断判定概率;对于告警概率较高的目标告警信息,为便于判定其业务中断概率,直接将告警概率大于、等于概率阈值的目标告警信息与告警信息数据库中的历史目标告警信息进行比对,并输出第一业务中断判定结果;对于告警概率小于概率阈值的目标告警信息,则进一步计算对应的业务中断概率,根据业务中断概率的数值输出目标告警信息的第二业务中断判定结果,从而便于对目标网络设备的多个网元的目标告警信息进行故障判定,有利于提高网络故障判定的计算判定效率;
59、3. 对于在同一指定的时间段内接收到的重复的告警信息数据,为便于减少数据处理的计算量,先基于相似度算法找出相似度相同或很高的网络告警信息,以得到对应的各个网络告警信息的相似度数据组,将相似度相同的两个以上的网络告警信息进行去重处理,接着再依序对去重处理后的多个告警信息数据进行格式标准化、明显逻辑错误、非需求数据和关键信息缺失等数据清洗工作,以便于从大量繁杂的网络告警信息中筛出比较有价值和可能造成业务中断的网络告警信息,便于对网络告警信息进行故障分析和处理。
本文地址:https://www.jishuxx.com/zhuanli/20240801/243858.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表