首页 / 常见问题 / 快速部署并集成 DevOps 工具失败,如何处理?

快速部署并集成 DevOps 工具失败,如何处理?

在双网卡集群中部署失败,错误提示为“check xx alive failed”

问题描述

在双网卡集群的 工具链管理 > 工具链集成 中快速部署并集成 DevOps 工具失败,且错误提示为“Internal error occured, check xx alive failed: context deadline exceeded”。

原因分析

双网卡集群中每个网卡有一个 IP 地址,但并不是两个网卡都支持集群外访问。创建集群时若选择了不支持集群外访问的 IP 地址作为节点默认 IP 地址,且部署工具链时保持平台默认配置使用该 IP 地址作为服务访问地址,将导致部署之后无法正常访问工具。

解决方法

  1. 通过 SSH 方式登录工具服务访问地址对应节点。

  2. 查询可提供集群外访问的默认路由对应网卡。

    # ip r
    default via 192.168.10.10 dev eth0 proto static metric 100 #本例表示默认路由对应网卡为 eth0
  3. 查询默认路由对应网卡的 IP 地址。

    # ip a s eth0
    eth0:
    ...
    inet 192.168.200.200/22 #本例中此为 eth0 的 IP 地址
  4. 工具链管理 > 工具链集成 中,使用前述 IP 地址更新工具集成信息中的访问地址和 API 地址。

参数配置无误,但仍有较低概率部署失败

问题描述

工具链管理 > 工具链集成 中快速部署并集成 DevOps 工具时,参数配置无误,但仍有较低概率部署失败。

原因分析

快速部署并集成部署 Harbor 或 GitLab 等工具时,如果没有部署工具所需 Operator,系统会自动部署 Operator。由于网络原因或主机性能等原因,有概率发生 Operator 部署超时导致 Harbor、GitLab 等工具部署失败。工具与 Operator 对应关系如下。

工具 Operator 部署成功的 Operator 名称
Harbor Harbor harbor-operator
GitLab、Jenkins、SonarQube、Nexus、Testlink DevOps Tools devops-tool-operator

解决方法

  1. 在左侧导航栏中,单击 应用商店管理 > Operators

  2. 单击 已部署 Operators 页签。

  3. 检查是否存在状态为 部署成功 的前述 Operator。

    • 存在,则在 工具链管理 > 工具链集成 中重新部署工具。

    • 不存在,则在 OperatorHub 中部署 Operator。待 Operator 部署成功后,重新部署工具。