本章节主要介绍在控制服务状态页面中,针对控制服务状态的监控信息说明,包括控制服务运行状态和控制子服务运行状态。其中,在云平台的顶部导航栏中,依次选择[产品与服务]-[可观测性]-[监控管理],然后在左导航栏中,选择[监控面板],点击[控制服务状态]页签,即可访问“控制服务状态”页面。
状态包含六种,分别为 运行中、警告、停止、未知、禁用 以及 无数据 。
- 运行中:当服务和其副本都在正常运行时,状态为运行中。
- 警告:当服务的副本数部分出错时,状态会变为 警告。此时将触发级别为 警告 的告警通知,如
部分计算调度服务 停止服务。
- 停止:当服务的副本数全部出错时,状态会变为 停止。此时将触发级别为 严重 的告警通知,如
计算调度服务 停止服务。
- 未知:当平台收到返回的监控数据与预期不符时,状态为未知。此时将触发级别为 严重 的告警通知。
- 无数据:从后端没有获取到数据,比如当获取数据的服务停止运行,该服务获取不到数据会显示无数据状态。此时将触发级别为 严重 的告警通知。
- 禁用 :当用户在界面关闭平台的Host-HA服务,状态为禁用。
当服务处于运行中或警告状态时,云平台仍然能够正常提供服务。这时,可能由于运行控制服务的节点进入维护模式或者与集群失去连接。此外,当时间同步服务或日志收集服务停止时,系统将会发出严重告警,这时,请等待系统自愈或联系您的软件服务提供商进行问题排查。
控制服务运行状态
控制服务运行状态展示的是集群中的核心服务运行状态,如控制管理服务、计算服务、网络API服务等。当该区域内的服务状态停止或无数据时,会影响集群业务的正常运行,导致服务中断。例如:当某个节点计算服务状态为停止或无数据时,平台将无法在该节点继续创建云主机。
控制子服务运行状态
控制子服务运行状态展示的是集群中的非核心服务运行状态,如块存储 API 服务、块存储服务、对象存储 API 服务等。当该区域内的服务状态停止或无数据时,表明该服务支撑的功能不可用,但不会影响集群承载业务的正常运行。例如:当块存储服务状态为停止或无数据时,您在云平台中将无法使用块存储相关功能,但不会影响您承载业务的云主机正常运行,因此不会影响您的业务正常运转。