首页 / 平台管理 / 集群管理 / 集群 / 节点管理 / 节点监控

节点监控

在节点详情页面,查看节点的监控数据。

提示

操作步骤

  1. 在左侧导航栏中,单击 集群管理 > 集群

  2. 单击待查看节点所在的 集群名称

  3. 节点 页签下,单击待查看 节点名称

  4. 单击 监控 页签,进入节点的监控数据展示页面,可查看节点的相关监控数据。

    提示:当集群下的节点个数大于 1 个时,在节点的详情页面,单击资源路径区域的 当前节点名称 可展开节点下拉列表,单击选择节点后可快速切换至其他节点的详情页面,如下图所示。

    说明

    在存储空间统计数据展示区域,当节点的存储空间的分区超过 4 个时:

    • 分区总量占比图中,占比从高到底排序的前 3 个分区会单独显示占比区域,剩余分区显示为 其他 占比区域,且光标移动至占比区域时,显示剩余分区的总量占比数据;

    • 分区使用率条形图中,使用率从高到底排序的前 3 个分区会单独显示条形图,剩余分区显示为 其他 条形图,且光标移动至条形图时,显示剩余分区的总使用率及各自的使用率。

    监控趋势统计数据说明参见下表。

    参数 说明
    CPU 指定时间范围内,CPU 的 使用率请求率限制率

    使用率 = 节点上所有容器组的 CPU 使用值 / 节点的 CPU 总额。
    注意:如果某一段时间节点的 CPU 使用率飙升,您必须首先定位占用 CPU 资源最多的进程。 例如:对于 Java 自定义应用程序,代码中出现内存泄漏或无限循环的情况可能会出现 CPU 使用率飙高。

    请求率 = 节点上所有容器组的 CPU 请求值 / 节点的 CPU 总额。
    注意:如果某一段时间节点的 CPU 请求率飙升,有可能是集群的超售比设置不合理或节点上运行的 Pod 的请求值设置过高,可能造成资源的浪费。

    限制率 = 节点上所有容器组的 CPU 限制值 / 节点的 CPU 总额。
    注意:如果某一段时间节点的 CPU 限制率飙升,说明节点上运行的 Pod 的限制值设置过高,可能造成 CPU 资源的浪费。
    内存 指定时间范围内,内存的 使用率请求率限制率

    使用率 = 节点上所有容器组的内存使用值 / 节点的内存总额。
    内存是服务器上的重要部件之一,是与 CPU 通信的桥梁。因此,内存的性能对机器有很大的影响。当程序运行时,数据加载、线程并发和 I/O 缓冲都依赖于内存。可用内存的大小决定了程序是否可以正常运行以及如何运行。

    请求率 = 节点上所有容器组的内存请求值 / 节点的内存总额。
    注意:如果某一段时间节点的内存请求率飙升,有可能是集群的超售比设置不合理或节点上运行的 Pod 的请求值设置过高,可能造成资源的浪费。

    限制率 = 节点上所有容器组的内存限制值 / 节点的内存总额。
    注意:如果某一段时间节点的内存限制率飙升,说明节点上运行的 Pod 的限制值设置过高,可能造成内存资源的浪费。
    存储 指定时间范围内,空间使用率inode 使用率

    空间使用率 = 存储空间使用值 / 存储空间总值。
    通过监控磁盘空间的历史数据,您可以评估给定时间段内磁盘的使用情况。 在磁盘使用率较高的情况下,您可以通过清理不必要的镜像或容器来释放磁盘空间。

    inode 使用率 = inode 存储使用值 / inode 存储总值。
    注意: 每个文件都必须有一个 inode,用于存储文件的元信息,如文件的创建者和创建日期。 Inode 还会消耗硬盘空间,许多小缓存文件很容易导致 inode 资源耗尽。 此外,在 inode 已用完但硬盘未满的情况下,无法在硬盘上创建新文件。
    系统负载 1 分钟、5 分钟、15 分钟内的 CPU 平均负载。取值为当前正在被 CPU 执行和等待被 CPU 执行的进程数目总和与 CPU 最大能执行的进程数目的比值,是反映系统忙闲程度的重要指标。

    说明:如果在一定时间内 1 分钟/ 5 分钟/ 15 分钟的曲线相似,则表明集群的 CPU 负载相对稳定。
    如果某一时段或某一特定时间点的 1 分钟的值远远大于 15 分钟的值,则表示最近 1 分钟的负荷在增加,需要继续观察。 一旦 1 分钟的值超过 CPU 数量,可能意味着系统超载。 你需要进一步分析问题的根源。
    如果某一时段或某一特定时间点的1分钟值远小于 15 分钟,则表示系统在最近 1 分钟内负载在降低,在前 15 分钟内产生了较高的负载。
    磁盘吞吐量 指定时间范围内,磁盘吞吐量是指磁盘传输数据流的速度,传输数据是读写数据的总和。
    磁盘 IOPS 指定时间范围内,磁盘 IOPS 是每秒连续读取和写入的总和,表示磁盘每秒读取和写入操作数的性能度量。
    网络流量速率 指定时间范围内,按节点物理网卡统计的网络流量的流入、流出速率。
    网络报文速率 (个/秒) 指定时间范围内,按节点物理网卡统计的网络报文的接收、发送速率。