Loading
close

什么是云监控服务

time 更新时间:2024-08-20 19:36:26

云监控服务(Cloud Monitoring Service,CMS)是面向用户的监控告警服务。通过云监控服务,可以帮助用户快速了解当前云平台的健康状态、容量使用情况以及存储集群使用状态等信息。云监控服务还为用户提供详细的云平台告警消息。当云平台运行状态异常时,可以查看告警消息,快速定位并及时解决问题,恢复云平台。

产品优势

  • 全方位监控覆盖

    为用户提供全方位的监控能力,一个云平台函盖数字原生引擎、云产品及用户负载监控数据。

  • 开箱即用

    为用户提供云产品开箱即用式的监控体验。用户只需要在使用云监控控制台后即可查看全方位的监控信息。

  • 轻运维

    可以对资源进行跨区域的集中式批量监控,使用告警功能设置告警规则,从单实例单资源的低效管理视角中脱离出来,让运维监控变得更高效有序。

  • 多种通知渠道

    告警服务可通过短信、邮件、企业微信、钉钉的方式推送给用户,方便及时获取告警消息。

  • 云产品监控能力

    默认为用户提供云产品常用监控指标,如对应云产品控制服务的资源占有率等,用户可以统一查看这些云产品的运行状态。

  • 开放API

    提供功能完善的OpenAPI,方便用户将监控数据、告警消息等内容与用户的运维平台做集成。

主要功能

  • 监控面板

    • 监控概览:对全平台的监控信息的全景展现,帮助用户迅速定位集群异常状态。
    • 控制服务状态:包括对数字原生引擎控制服务、云产品控制服务运行状态监控。
    • 存储集群状态:包含存储集群健康状态、存储集群容量统计、存储集群IOPS/带宽、数据盘Smart信息、磁盘温度和磁盘坏扇区检测信息。
    • 节点状态:包含节点CPU/内存使用情况、磁盘I/O使用率/速率/延迟、系统负载、网卡流量和温度、电风扇转速信息。
    • 其它服务:提供包括RabbitMQ、Etcd的集群状态、节点状态、状态趋势和资源监控。
  • 告警概览

    告警概览直观地展示了整个云平台或项目级别的告警消息汇总和告警资源分配情况。

  • 告警消息

    告警消息由触发中的告警规则产生,提供实时和历史告警的状态、级别、详情、来源等信息,帮助用户快速实现故障定位与异常排查,并支持屏蔽、取消屏蔽等操作来暂停和恢复实时消息的通知。

  • 告警分组

    告警分组是关联告警规则与告警订阅的载体,告警分组会将组内规则产生的告警消息发送至目标订阅终端,并支持为关联的告警订阅设置单独的订阅策略。

  • 告警订阅

    告警订阅即通知渠道,支持设置邮箱、webhook地址类型的订阅终端,以接收已关联告警分组中的实时消息。

  • 配额管理

    通过配额管理,对云监控服务相关的后台资源数量进行限制。

此篇文章对你是否有帮助?
没帮助
locked-file

您暂无权限访问该产品