快速部署并集成 DevOps 工具失败,如何处理?
在双网卡集群中部署失败,错误提示为“check xx alive failed”
问题描述
在双网卡集群的 工具链管理 > 工具链集成 中快速部署并集成 DevOps 工具失败,且错误提示为“Internal error occured, check xx alive failed: context deadline exceeded”。
原因分析
双网卡集群中每个网卡有一个 IP 地址,但并不是两个网卡都支持集群外访问。创建集群时若选择了不支持集群外访问的 IP 地址作为节点默认 IP 地址,且部署工具链时保持平台默认配置使用该 IP 地址作为服务访问地址,将导致部署之后无法正常访问工具。
解决方法
-
通过 SSH 方式登录工具服务访问地址对应节点。
-
查询可提供集群外访问的默认路由对应网卡。
# ip r default via 192.168.10.10 dev eth0 proto static metric 100 #本例表示默认路由对应网卡为 eth0
-
查询默认路由对应网卡的 IP 地址。
# ip a s eth0 eth0: ... inet 192.168.200.200/22 #本例中此为 eth0 的 IP 地址
-
在 工具链管理 > 工具链集成 中,使用前述 IP 地址更新工具集成信息中的访问地址和 API 地址。
参数配置无误,但仍有较低概率部署失败
问题描述
在 工具链管理 > 工具链集成 中快速部署并集成 DevOps 工具时,参数配置无误,但仍有较低概率部署失败。
原因分析
快速部署并集成部署 Harbor 或 GitLab 等工具时,如果没有部署工具所需 Operator,系统会自动部署 Operator。由于网络原因或主机性能等原因,有概率发生 Operator 部署超时导致 Harbor、GitLab 等工具部署失败。工具与 Operator 对应关系如下。
工具 | Operator | 部署成功的 Operator 名称 |
---|---|---|
Harbor | Harbor | harbor-operator |
GitLab、Jenkins、SonarQube、Nexus、Testlink | DevOps Tools | devops-tool-operator |
解决方法
-
在左侧导航栏中,单击 应用商店管理 > Operators。
-
单击 已部署 Operators 页签。
-
检查是否存在状态为
部署成功
的前述 Operator。-
存在,则在 工具链管理 > 工具链集成 中重新部署工具。
-
不存在,则在 OperatorHub 中部署 Operator。待 Operator 部署成功后,重新部署工具。
-