监控面板
监控面板分页面展示平台各类关键服务的运行状态,包括监控概览页面、控制服务状态页面、存储集群状态页面、节点状态页面和其他服务(RabbitMQ、Etcd、APIServer)页面。
监控目标
监控服务通过监控目标抓取指标数据,生成时间序列持久化到数据库中。如果监控目标状态异常,将无法抓取到指标数据,对应服务的本身业务也可能已经中断,需要立刻排查故障。
告警消息
告警消息由触发中的告警规则产生,提供实时和历史告警的状态、级别、详情、来源等信息,帮助用户快速实现故障定位与异常排查。
告警分组
告警分组是关联告警规则与告警订阅的载体,告警分组会将组内规则产生的告警消息发送至目标订阅终端。
告警分组分为内置分组和自定义分组,用户可以创建自定义资源,以满足差异化需求。
用户可以按需订阅,方便随时掌握关注的服务状态。告警规则
使用收集上来的监控指标,编写具有实际意义的告警表达式,再添加告警通知的具体内容,就形成了一条告警规则;每条告警规则属于一个告警分组。
告警规则分为内置规则和自定义规则,用户可以创建自定义资源,以满足差异化需求。
告警规则又分为严重、警告、信息3个级别,方便用户区分告警的严重程度。告警消息、告警分组、告警规则共分为3个类型:
- 数字原生引擎:针对平台控制服务、集群、硬件等设置的告警资源,仅云管理员可以访问。
- 云产品:针对平台已安装云产品设置的告警资源,仅云管理员可以访问。
- 用户负载:用户创建的容器、裸金属主机、负载均衡实例等,针对这些设置的告警资源,平台用户在授权项目下可以访问。
每个类型的告警资源又同时属于某个组件,包括但不限于:
- 数字原生引擎:自动化中心,云开放平台,微服务编排系统,磐石云操作系统,分布式存储,事件网格,云控制台,主机高可用,身份与访问管理,平台中间件,监控基础服务,日志基础服务,通用。
- 云产品:高性能存储,容灾服务,资源编排,裸金属服务,Kubernetes容器服务,安全容器服务,应用中心,计算服务,镜像服务,块存储服务,网络服务,可观测服务,计量服务,计费服务,独享型负载均衡,通用。
- 用户负载:可选项同云产品分类。
告警订阅
告警订阅即通知渠道,支持设置邮件、企业微信、钉钉、飞书、Webhook类型的订阅终端,以接收已关联告警分组中的实时消息。
订阅终端
订阅终端即告警消息的某个接收方,例如:一条邮件地址,一个群机器人地址,一个Webhook URL;每个订阅终端属于一个告警订阅。
基本概念
此篇文章对你是否有帮助?
有帮助
没帮助
您暂无权限访问该产品
转到首页