快速部署并集成 DevOps 工具失败,如何处理?
在双网卡集群中部署失败,错误提示为“check xx alive failed”
问题描述
在双网卡集群的 工具链管理 > 工具链集成 中快速部署并集成 DevOps 工具失败,且错误提示为“Internal error occured, check xx alive failed: context deadline exceeded”。
原因分析
双网卡集群中每个网卡有一个 IP 地址,但并不是两个网卡都支持集群外访问。创建集群时若选择了不支持集群外访问的 IP 地址作为节点默认 IP 地址,且部署工具链时保持平台默认配置使用该 IP 地址作为服务访问地址,将导致部署之后无法正常访问工具。
解决方法
- 
通过 SSH 方式登录工具服务访问地址对应节点。 
- 
查询可提供集群外访问的默认路由对应网卡。 # ip r default via 192.168.10.10 dev eth0 proto static metric 100 #本例表示默认路由对应网卡为 eth0
- 
查询默认路由对应网卡的 IP 地址。 # ip a s eth0 eth0: ... inet 192.168.200.200/22 #本例中此为 eth0 的 IP 地址
- 
在 工具链管理 > 工具链集成 中,使用前述 IP 地址更新工具集成信息中的访问地址和 API 地址。 
参数配置无误,但仍有较低概率部署失败
问题描述
在 工具链管理 > 工具链集成 中快速部署并集成 DevOps 工具时,参数配置无误,但仍有较低概率部署失败。
原因分析
快速部署并集成部署 Harbor 或 GitLab 等工具时,如果没有部署工具所需 Operator,系统会自动部署 Operator。由于网络原因或主机性能等原因,有概率发生 Operator 部署超时导致 Harbor、GitLab 等工具部署失败。工具与 Operator 对应关系如下。
| 工具 | Operator | 部署成功的 Operator 名称 | 
|---|---|---|
| Harbor | Harbor | harbor-operator | 
| GitLab、Jenkins、SonarQube、Nexus、Testlink | DevOps Tools | devops-tool-operator | 
解决方法
- 
在左侧导航栏中,单击 应用商店管理 > Operators。 
- 
单击 已部署 Operators 页签。 
- 
检查是否存在状态为 部署成功的前述 Operator。- 
存在,则在 工具链管理 > 工具链集成 中重新部署工具。 
- 
不存在,则在 OperatorHub 中部署 Operator。待 Operator 部署成功后,重新部署工具。 
 
-