Loading
close

基本概念

time 更新时间:2024-08-20 19:36:26
  • 监控面板

    监控面板分页面展示平台各类关键服务的运行状态,包括监控概览页面、控制服务状态页面、存储集群状态页面、节点状态页面和其他服务(RabbitMQ、Etcd、APIServer)页面。

  • 监控目标

    监控服务通过监控目标抓取指标数据,生成时间序列持久化到数据库中。如果监控目标状态异常,将无法抓取到指标数据,对应服务的本身业务也可能已经中断,需要立刻排查故障。

  • 告警消息

    告警消息由触发中的告警规则产生,提供实时和历史告警的状态、级别、详情、来源等信息,帮助用户快速实现故障定位与异常排查。

  • 告警分组

    告警分组是关联告警规则与告警订阅的载体,告警分组会将组内规则产生的告警消息发送至目标订阅终端。
    告警分组分为内置分组和自定义分组,用户可以创建自定义资源,以满足差异化需求。
    用户可以按需订阅,方便随时掌握关注的服务状态。

  • 告警规则

    使用收集上来的监控指标,编写具有实际意义的告警表达式,再添加告警通知的具体内容,就形成了一条告警规则;每条告警规则属于一个告警分组。
    告警规则分为内置规则和自定义规则,用户可以创建自定义资源,以满足差异化需求。
    告警规则又分为严重、警告、信息3个级别,方便用户区分告警的严重程度。

    告警消息、告警分组、告警规则共分为3个类型:

    • 数字原生引擎:针对平台控制服务、集群、硬件等设置的告警资源,仅云管理员可以访问。
    • 云产品:针对平台已安装云产品设置的告警资源,仅云管理员可以访问。
    • 用户负载:用户创建的容器、裸金属主机、负载均衡实例等,针对这些设置的告警资源,平台用户在授权项目下可以访问。

    每个类型的告警资源又同时属于某个组件,包括但不限于:

    • 数字原生引擎:自动化中心,云开放平台,微服务编排系统,磐石云操作系统,分布式存储,事件网格,云控制台,主机高可用,身份与访问管理,平台中间件,监控基础服务,日志基础服务,通用。
    • 云产品:高性能存储,容灾服务,资源编排,裸金属服务,Kubernetes容器服务,安全容器服务,应用中心,计算服务,镜像服务,块存储服务,网络服务,可观测服务,计量服务,计费服务,独享型负载均衡,通用。
    • 用户负载:可选项同云产品分类。
  • 告警订阅

    告警订阅即通知渠道,支持设置邮件、企业微信、钉钉、飞书、Webhook类型的订阅终端,以接收已关联告警分组中的实时消息。

  • 订阅终端

    订阅终端即告警消息的某个接收方,例如:一条邮件地址,一个群机器人地址,一个Webhook URL;每个订阅终端属于一个告警订阅。

此篇文章对你是否有帮助?
没帮助
locked-file

您暂无权限访问该产品