为自建集群添加节点
当集群需要扩容,或需要用新的节点替换集群上的异常节点时。可通过添加节点,为平台上已有的 自建 业务集群添加控制节点和计算节点。
约束与限制
-
已准备好待添加至集群的节点。请参照 节点可用性检查参照表 准备、检查待添加至集群的节点。确保条件均已满足,否则可能会导致集群部署失败。
-
待添加节点的硬件架构需与集群硬件架构一致。
-
为避免发生不可预知的错误,待添加节点的操作系统类型应与集群中的其它节点保持一致。
-
在同一个 添加节点 对话框中添加的节点的 SSH 端口以及认证信息需要统一。
-
集群中控制节点的个数只能为 1、3、5。
-
一个节点只能属于一个集群,待添加节点不能被其他集群占用。
前提条件
-
如需为 GPU 集群添加 GPU 节点,需要先行为 GPU 节点安装 GPU 驱动,请参考 安装 GPU 驱动 。
-
当 global 集群无法直接通过 SSH 服务访问待添加至集群的节点,而需要通过代理(Alpha 功能,打开功能开关后有效)访问时,请提前准备好代理服务。目前仅支持 SOCKS5 代理。
操作步骤
-
在左侧导航栏中,单击 集群管理 > 集群。
-
单击待添加节点的类型为 自建 的 集群名称。
-
在 节点 页签下,单击 添加节点。
-
参考 节点配置参数说明 ,配置相关参数。
-
单击 添加,将对节点进行可用性检查。
检查通过后开始添加节点,节点处于 添加中 状态。
后续操作
查看执行进度
在节点列表页面,可查看已添加的节点的列表信息,其中,处在 添加中 状态的节点,可查看执行进度。
操作步骤
-
单击处于 添加中 状态的节点右侧的
> 查看执行进度。
-
在弹出的执行进度弹窗中,可查看节点的执行进度(status.conditions)。
提示:当某个类型正在执行中或状态为失败且有原因时,光标悬浮在对应的原因(显示蓝色字体)上时,可查看原因(status.conditions.reason)的详细信息。
重新添加添加失败的节点
添加节点后,当有节点添加失败后,节点列表上方将会弹出提示,单击提示框里的 重新添加 按钮,即可重新添加添加失败的节点。
