节点信息
您可以通过节点信息查看您的环境的节点的运行状态,包括物理节点/虚拟节点,在线与离线节点以及节点列表的概览您可以通过点击 节点管理 链接进入节点信息页面, 节点信息中可以查看每个节点的运行情况以及配置信息,并且可以对节点进行维护管理,维护情况下支持更换数据盘、删除节点等操作。
节点类型介绍
-
物理节点
一个云环境中包含一组物理节点,每个物理节点对应一台物理服务器。物理节点可分为不同的角色,如控制节点、计算节点、存储节点和融合节点等。其中带计算角色的物理节点可以运行云主机。物理节点也可简称为“节点”。 -
虚拟节点
一个虚拟节点对应一台虚机,用来独立运行一个或一组服务,例如:云产品节点。 -
节点角色
一个节点角色对应一个或一组服务,平台有以下几种角色:计算节点、存储节点、计算存储节点、控制节点、安全容器节点、云产品节点(虚拟节点)。
警告:云产品节点的配置在x86环境为8C16G,ARM环境为16C-16G。
您可以通过页面上方的过滤列表查看 已部署节点 和 未部署节点 ,已部署节点 即包括集群中已经部署并运行的节点,您可以查看不同角色下的节点列表信息并可执行相应操作;未部署节点 包括待部署节点和不可部署节点。
待部署节点:该类节点代表节点已授权但还未部署,您可以在云环境扩容页面中执行扩容操作。对于离线的可部署节点,您可以将其恢复为在线后执行部署操作,也可执行移除操作,移除后该节点将不在集群中管理。
不可部署节点:不可部署节点包括多种情况,例如 待授权 、 不可授权 、以及 配置不满足 节点。
- 待授权:在许可中包含了该节点的序列号,需要进行授权操作将节点纳入集群管理,授权后可以查看节点角色分配情况。
- 不可授权:该状态节点有以下两种情况,其一是节点序列号未在许可中包含,您可以更新许可后,执行扩容操作。另一种是该节点序列号在许可中包含,但节点离线,仍然无法授权。
- 配置不满足:该状态节点硬件配置不符合节点角色的硬件规格要求,在更改节点硬件配置后,该节点将会被重新发现,您可以再次对其进行授权操作。
对于不可部署节点您可以执行移除操作,移除时系统会判断该节点是否已离线,若未离线,需要您先将该节点离线,再执行移除操作。
节点详情
在 节点管理 页面,您可以看到在每个节点后都有 查看详情 功能,点击 查看详情,进入当前节点的详情页面,您可以看到节点的 硬件信息、网卡配置 以及 硬盘配置。
硬件信息
通过硬件信息,您可以查看集群中硬件节点的处理器、硬盘、网卡详细配置。
网卡配置
通过网卡配置,您可以了解物理节点的网卡的运行状态、网卡Bond关系以及对应网卡的MTU配置。
硬盘配置
通过硬盘配置,您可以查看节点所有硬盘的容量,raid关系以及分区划分情况,如果您更换数据盘或者缓存盘,可以通过硬盘数据条目后面硬盘点灯功能定位节点该硬盘的位置。
产品平台目前支持以许可的方式部署多个缓存磁盘组来满足业务对性能更高的要求,平台中有缓存磁盘组后,您可以通过配置页面看到缓存磁盘组的状态,以及缓存磁盘组内所有硬盘的关系。
缓存磁盘组窗口默认收起,在缓存磁盘组折叠窗口中可以看到缓存磁盘组内缓存盘和数据盘的状态以及总容量;点击展开,展示缓存磁盘组的详细信息。
警告:
- 硬盘配置中硬盘类型为:NVMe固态硬盘、SATA固态硬盘、SATA机械硬盘、SAS机械硬盘,其中NVMe固态硬盘没有点灯的功能;
- 缓存磁盘组内数据盘可做jbod;缓存盘可做jbod;
- 当缓存盘和数据盘做raid0时,在缓存磁盘组收起的窗口展示的总容量为逻辑缓存盘和逻辑数据盘的总容量,在展开窗口中展示的每块盘的容量为该盘对应的物理磁盘的总容量。
- 虚拟节点不支持查看详情页。
硬盘配置页面,系统盘可做raid0、raid1、非raid;系统盘默认收起,在系统盘的收起的窗口展示系统盘逻辑盘的总容量、引导分区总容量、操作系统总容量以及容器分区总容量,当系统盘做raid0,展开窗口中,每块盘显示的操作系统分区总容量为该物理磁盘的实际容量,每块盘的详细信息中的分区容量为系统盘逻辑盘的分区总容量。系统盘做raid1或者非raid,展开窗口中,每块盘显示的操作系统分区总容量为该物理磁盘的实际容量,每块盘的详细信息中的分区容量为系统盘对应物理磁盘的实际容量。
节点维护与删除
在云环境概览界面中点击节点详情中的 节点管理 按钮,进入 节点信息 页面,您可以在界面中选择要维护的节点,点击 维护 按钮。
如果节点维护失败,您可以尝试 继续维护。
在节点进入维护模式后,您可以执行 删除 节点操作,或者点击 恢复 退出维护模式。
警告:
一、当您选择删除的节点上运行了云主机相关业务时,请通过在线迁移云主机/批量迁移云主机/冷迁移云主机等操作将云主机从该节点上迁出,否则系统在删除集群节点前会检测该节点是否有云主机,如果存在云主机,您将无法删除该节点。
二、当您维护一个运行关键控制服务的节点并恢复之后,如果您需要维护另一个运行关键控制服务的节点,您需要前往云监控平台,查看控制服务监控状态,等待控制服务状态全部变为“运行中”之后,再执行另一个运行关键控制服务的节点的维护操作。
如果节点恢复失败,您可以尝试 继续恢复。
强制删除节点
当节点处于离线或者异常状态,并且您确认该节点不再加入集群,您可以通过强制删除功能将节点从集群中移除。系统会在强制删除节点前检查云主机是否存在,如果存在,您需要通过撤离云主机 将云主机从节点撤离,撤离云主机功能将在节点离线情况下,将云主机在其他节点重建。
云监控平台默认会对云环境集群中所有的硬盘设备进行监控,实时反馈硬盘设备的健康性和IO状态,如果发现硬盘处于慢盘、损坏、接近使用寿命期限时,会向用户指定的收件邮箱发送告警邮件。此时我们推荐您立刻更换异常状态的硬盘,降低数据丢失风险。
警告:当存储集群健康状态告警时,用户无法删除集群中的任何节点,此时您可以等待存储集群自恢复。若确认了导致存储集群状态异常的原因且集群将始终无法恢复时(如某一节点上的两块缓存盘全部损坏时),您可以将节点置于维护模式,并且将节点关机后启用强制删除功能。