基于业务指标的全链路监控系统、方法及存储介质与流程
- 国知局
- 2024-08-02 14:03:21
本技术涉及运维,尤其涉及一种基于业务指标的全链路监控系统、方法及存储介质。
背景技术:
1、随着科技信息产业的发展,越来越多的企业走向智能化,尤其是在金融行业,企业的日常运行已经越来越离不开自动化产品的支持。各个自动化产品须保持稳定、良好的运行状态,才能保证整个企业健康发展。因此,对系统平台中的各个自动化产品进行运维监控,及时发现问题,具有重大意义。
2、而在传统的运维监控方式中,一般是运维接收到各部门人员的监控需求,再根据需要监控的内容配置进行运维监控。当发现异常告警的情况下,才进行人工介入排查问题。这种运维监控方式对于公司业务的整体监控一般为技术单点监控,在这种基于需求式的被动监控模式下,大部分情况下会陷入被动告警的局面,运维监控的效果较低。
3、上述内容仅用于辅助理解本技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本技术的主要目的在于提供了一种基于业务指标的全链路监控系统、方法及存储介质,旨在解决传统的运维监控方式对于公司业务的整体监控一般为技术单点监控,大部分情况下会陷入被动告警的局面,导致运维监控的效果较低的技术问题。
2、为实现上述目的,本技术提出一种基于业务指标的全链路监控系统,所述系统包括:指标配置管理模块、链路管理模块、智能化中心模块以及可视化中心模块;
3、所述指标配置管理模块,用于将监控对象与指标体系的监控指标进行关联配置,并将配置获得的指标关联关系发送至所述链路管理模块,所述指标体系包括所述监控对象在每个层级的特质属性对应的监控指标;
4、所述链路管理模块,用于根据所述指标关联关系对所述监控对象进行链路构建,获得横向调用链路和纵向拓扑图;
5、所述智能化中心模块,用于根据所述横向调用链路和所述纵向拓扑图进行故障趋势预测,获得预测结果;
6、所述可视化中心模块,用于基于所述指标关联关系、所述横向调用链路、所述纵向拓扑图和所述预测结果生成运维监控展示页面。
7、在一实施例中,所述指标配置管理模块包括:标签管理子模块、指标管理子模块、规则管理子模块和策略管理子模块;
8、所述标签管理子模块,用于对所述监控对象进行场景划分,确定所述监控对象的标签信息,所述标签信息包括标签名称、标签类别和标签关联的场景入口;
9、所述指标管理子模块,用于根据所述标签信息配置所述指标体系的基本指标信息;
10、所述规则管理子模块,用于根据所述基本指标信息配置所述指标体系的规则类型及规则计算方式;
11、所述策略管理子模块,用于将所述监控指标与规则计算方式进行绑定,确定绑定后的监控指标;
12、所述指标管理子模块,用于将所述监控对象与所述绑定后的监控指标进行关联配置,获得指标关联关系。
13、在一实施例中,所述链路管理模块包括:横向调用链路子模块和纵向拓扑图子模块;
14、所述横向调用链路子模块,用于基于所述监控指标采集所述监控对象的运行日志,并通过apm自动针对请求进行采样,采集服务间的调用关系,构建横向调用链路,以实现全局调用链路的自动跟踪;
15、所述纵向拓扑图子模块,用于以cmdb为基础,采集系统和组件的调用关系,以构建纵向拓扑图。
16、在一实施例中,所述横向调用链路子模块,还用于将所述运行日志的全局链路id、链路span id、父span id进行串联,构成初始树型调用链路;
17、所述横向调用链路子模块,还用于将所述初始树型调用链路的全局链路id进行下传递,生成横向调用链路。
18、在一实施例中,所述智能化中心模块包括:告警预测子模块、告警收敛子模块和告警修复子模块;
19、所述告警预测子模块,用于基于时序模型对所述纵向拓扑图进行趋势预测,获得预测结果;
20、所述告警收敛子模块,用于在所述预测结果包括告警信息时,对所述监控对象进行问题定位,确定所述告警信息对应的问题根因,所述告警信息包括规则告警和预测告警;
21、所述告警修复子模块,用于基于知识库和大数据模型对所述问题根因进行关键信息匹配,并根据匹配方案对所述问题根因进行修复。
22、在一实施例中,所述智能化中心模块还包括告警自愈子模块;
23、所述告警自愈子模块,还用于在故障场景为应用接口场景时,将告警故障对应的监控对象与应用接口进行关联,并根据关联结果确定所述应用接口的版本信息;
24、所述告警自愈子模块,还用于根据所述版本信息对所述告警故障进行回退自愈。
25、此外,为实现上述目的,本技术还提出一种基于业务指标的全链路监控方法,所述方法应用于基于业务指标的全链路监控系统,所述系统包括:指标配置管理模块、链路管理模块、智能化中心模块以及可视化中心模块;所述方法包括:
26、所述指标配置管理模块将监控对象与指标体系的监控指标进行关联配置,并将配置获得的指标关联关系发送至所述链路管理模块,所述指标体系包括所述监控对象在每个层级的特质属性对应的监控指标;
27、所述链路管理模块根据所述指标关联关系对所述监控对象进行链路构建,获得横向调用链路和纵向拓扑图;
28、所述智能化中心模块根据所述横向调用链路和所述纵向拓扑图进行故障趋势预测,获得预测结果;
29、所述可视化中心模块基于所述指标关联关系、所述横向调用链路、所述纵向拓扑图和所述预测结果生成运维监控展示页面。
30、在一实施例中,所述指标配置管理模块包括:标签管理子模块、指标管理子模块、规则管理子模块和策略管理子模块;所述指标配置管理模块将监控对象与指标体系的监控指标进行关联配置,并将配置获得的指标关联关系发送至所述链路管理模块的步骤,包括:
31、所述标签管理子模块对所述监控对象进行场景划分,确定所述监控对象的标签信息,所述标签信息包括标签名称、标签类别和标签关联的场景入口;
32、所述指标管理子模块根据所述标签信息配置所述指标体系的基本指标信息;
33、所述规则管理子模块根据所述基本指标信息配置所述指标体系的规则类型及规则计算方式;
34、所述策略管理子模块将所述监控指标与规则计算方式进行绑定,确定绑定后的监控指标;
35、所述指标管理子模块将所述监控对象与所述绑定后的监控指标进行关联配置,获得指标关联关系。
36、在一实施例中,所述链路管理模块包括:横向调用链路子模块和纵向拓扑图子模块;所述链路管理模块根据所述指标关联关系对所述监控对象进行链路构建,获得横向调用链路和纵向拓扑图的步骤,包括:
37、所述横向调用链路子模块基于所述监控指标采集所述监控对象的运行日志,并通过apm自动针对请求进行采样,采集服务间的调用关系,构建横向调用链路,以实现全局调用链路的自动跟踪;
38、所述纵向拓扑图子模块用于以cmdb为基础,采集系统和组件的调用关系,以构建纵向拓扑图。
39、此外,为实现上述目的,本技术还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的基于业务指标的全链路监控方法的步骤。
40、本技术提出的一个或多个技术方案,至少具有以下技术效果:本技术提出了一种基于业务指标的全链路监控系统,所述系统包括:指标配置管理模块、链路管理模块、智能化中心模块以及可视化中心模块;所述指标配置管理模块,用于将监控对象与指标体系的监控指标进行关联配置,并将配置获得的指标关联关系发送至所述链路管理模块,所述指标体系包括所述监控对象在每个层级的特质属性对应的监控指标;所述链路管理模块,用于根据所述指标关联关系对所述监控对象进行链路构建,获得横向调用链路和纵向拓扑图;所述智能化中心模块,用于根据所述横向调用链路和所述纵向拓扑图进行故障趋势预测,获得预测结果;所述可视化中心模块,用于基于所述指标关联关系、所述横向调用链路、所述纵向拓扑图和所述预测结果生成运维监控展示页面。由于本技术将监控对象与监控指标配置指标关联关系,并以此构建横向调用链路和纵向拓扑图进行故障趋势预测,避免了传统技术单点运维监控易陷入被动告警的局面,提高了运维监控效率。
本文地址:https://www.jishuxx.com/zhuanli/20240801/241557.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表