首页 / 平台管理 / 概览

概览

在平台管理页面中,管理员可管理已部署的产品以及集群、Kubernetes 资源、平台的用户、角色、IDP、许可证等,并可查看平台的运营统计数据和平台的审计、运维数据。

在概览功能页中,为您提供了平台资源可视化监控数据的汇总界面,可以帮助用户快速、全面地了解平台的整体资源规模和资源的运行情况。重点突出了资源数据运行趋势和异常信息,能够帮助用户及时发现并定位问题,大幅提升线上问题的诊断效率。

界面总览

序号 名称 描述
1 历史消息 平台管理员发布的通知消息。
2 帮助文档/关于平台/平台健康状态
  • 帮助文档:该文档展示了当前所在平台的功能说明。
  • 关于平台:平台默认开源组件的版本信息。
  • 平台健康状态:平台各个组件的健康状态。
  • 3 功能导航栏 产品功能导航菜单。
    4 功能操作区 用户操作或资源信息展示区域。

    操作权限说明

    平台管理视图仅对拥有平台管理权限、集群管理权限、平台审计权限的用户可见。以系统自定义角色为例:

    常规操作

    以下为您说明平台上符合大部分功能操作场景的一些常规操作,方便您后续顺畅地使用平台功能。

    常规操作 操作步骤 补充说明
    打开功能入口 在左侧导航栏中单击相应的功能菜单项。 -
    查看资源
    1. 在左侧导航栏中单击相应的菜单项,进入资源列表页面。
    2. 单击资源名称,查看资源详情。
    • 资源列表罗列了平台相应功能模块下已创建的与功能相关的资源,可在资源列表页面查看资源的关键信息,并执行快捷操作。
    • 资源详情页面可执行资源管理操作,部分详情页可切换页签。
    创建资源
    1. 在左侧导航栏中单击相应的菜单项,进入资源列表页面。
    2. 单击 创建 xx
    创建资源时,通常需要您输入资源相关的参数值,具体请参考功能模块说明文档。
    更新资源
    1. 在左侧导航栏中单击相应的菜单项,进入资源列表页面。
    2. 单击待更新资源记录右侧的 > 更新

    1. 在左侧导航栏中单击相应的菜单项,进入资源列表页面。
    2. 单击资源名称,进入资源详情页面。
    3. 单击页面右上角的 操作 > 更新
    更新资源时,通常仅支持更新资源的部分参数信息,不允许更新资源的名称等标识资源关键属性的参数,具体请参考创建操作进行更新。
    删除资源
    1. 在左侧导航栏中单击相应的菜单项,进入资源列表页面。
    2. 单击待更新资源记录右侧的 > 删除
    1. 在左侧导航栏中单击相应的菜单项,进入资源列表页面。
    2. 单击资源名称,进入资源详情页面。
    3. 单击页面右上角的 操作 > 删除
    删除资源操作不可逆,请谨慎执行。通常界面会弹出提示要求您进行二次确认,请根据提示执行相应操作即可。

    功能成熟度说明

    平台上的功能,按照成熟度可分为 Alpha 版本、Beta 版本、GA(General Availability)版本。

    Beta 版本、GA(General Availability)版本的功能已趋于稳定或正在稳定迭代的过程当中,有专业的团队提供保障和服务,您可以根据实际的需要在生产环境中使用相应的功能。

    Alpha 版本的功能,可能存在缺陷或严重 Bug,默认不在生产环境中开启,仅建议在体验或测试平台功能时所搭建的环境部署。

    为了方便您区分 Alpha 版本的功能,文档左侧的目录结构中,会以在相应功能模块或具体功能的导航菜单上标注 Alpha 的方式,提示您哪些是 Alpha 版本的功能。例如:创建子网(Alpha)。

    平台功能成熟度的说明及建议使用的范围请参见下表。

    版本 成熟度说明 建议使用范围
    Alpha - 可能是有缺陷的,可能包含错误,启用后可能会遇到严重 Bug。
    - 支持的功能可能在没有通知的情况下随时删除。
    - API、产品场景化封装、交互流程等更改可能会带来兼容性问题,但是,在后续的版本发布时不会特意声明。
    - 依赖的 Kubernetes 功能如果是 Alpha 版本,相应的平台功能只能为 Alpha 版本。
    私有环境部署时,默认关闭 Alpha 版本功能,如果需要,部署时可通过配置相关参数打开。
    由于存在 Bugs 风险,同时,可能不会做长期的支持,推荐在短暂的功能体验或测试环境中使用,例如:POC 环境。
    Beta - 可能存在缺陷,所有已支持的功能不会被轻易删除。
    - API 参数、产品设计细节等可能会随版本迭代发生变化。出现这种情况时,我们将提供迁移到下一个版本的说明。执行编辑操作时需要谨慎操作,可能需要停用依赖该功能的应用程序。
    默认开启 Beta 版本功能,部署时可通过配置相关参数关闭。
    后续版本中可能存在不兼容的更改,建议仅用于非关键型业务运行环境。如果有多个可以独立升级的集群,则可以放宽此限制,在生产环境使用。
    GA - 功能的稳定版本,将出现在许多后续版本中。
    - API 参数、产品设计细节等可能会随长期支持版本发生变化。出现这种情况时,我们将提供迁移到下一个版本的说明。
    适用于所有环境,包括生产环境。

    平台监控数据说明

    平台的概览功能将数据以图形化界面的形式,分区展示了资源统计数据和用量统计数据。其中,资源统计数据涵盖了集群、项目、节点、CPU、内存、容器组、用户、角色、命名空间;用量统计数据涵盖了集群资源使用率 Top 5、节点资源使用率 Top 5、资源使用率、容器组数量、告警触发次数。同时,支持以下功能:

    注意:仅支持查看已部署监控组件集群的概览数据。

    在概览页面,可查看资源统计数据部分和用量统计数据部分。以下将结合图示分别说明。

    资源统计数据

    用量统计数据

    监控趋势统计数据说明参见下表。

    参数 说明
    CPU 指定时间范围内,CPU 的 使用率请求率

    使用率 = 集群上所有容器组的 CPU 使用值 / 集群的 CPU 总额。
    注意:如果某一段时间集群的 CPU 使用率飙升,您必须首先定位占用 CPU 资源最多的进程。 例如:对于 Java 自定义应用程序,代码中出现内存泄漏或无限循环的情况可能会出现 CPU 使用率飙高。

    请求率 = 集群上所有容器组的 CPU 请求值 / 集群的 CPU 总额。
    注意:如果某一段时间集群的 CPU 请求率飙升,有可能是集群的超售比设置不合理或集群上运行的 Pod 的请求值设置过高,可能造成资源的浪费。
    内存 指定时间范围内,内存的 使用率请求率

    使用率 = 集群上所有容器组的内存使用值 / 集群的内存总额。
    内存是服务器上的重要部件之一,是与 CPU 通信的桥梁。因此,内存的性能对机器有很大的影响。当程序运行时,数据加载、线程并发和 I/O 缓冲都依赖于内存。可用内存的大小决定了程序是否可以正常运行以及如何运行。

    请求率 = 集群上所有容器组的内存请求值 / 集群的内存总额。
    注意:如果某一段时间集群的内存请求率飙升,有可能是集群的超售比设置不合理或集群上运行的 Pod 的请求值设置过高,可能造成资源的浪费。
    容器组数量 指定时间范围内,集群中处于运行中状态的容器组数量和所有容器组总数。
    告警触发次数 指定时间范围内,触发的集群相关告警、节点相关告警、计算组件相关告警的个数。