概览
在平台管理页面中,管理员可管理已部署的产品以及集群、Kubernetes 资源、平台的用户、角色、IDP、许可证等,并可查看平台的运营统计数据和平台的审计、运维数据。
在概览功能页中,为您提供了平台资源可视化监控数据的汇总界面,可以帮助用户快速、全面地了解平台的整体资源规模和资源的运行情况。重点突出了资源数据运行趋势和异常信息,能够帮助用户及时发现并定位问题,大幅提升线上问题的诊断效率。
界面总览

序号 | 名称 | 描述 |
---|---|---|
1 | 历史消息 | 平台管理员发布的通知消息。 |
2 | 帮助文档/关于平台/平台健康状态 | |
3 | 功能导航栏 | 产品功能导航菜单。 |
4 | 功能操作区 | 用户操作或资源信息展示区域。 |
操作权限说明
平台管理视图仅对拥有平台管理权限、集群管理权限、平台审计权限的用户可见。以系统自定义角色为例:
-
平台管理员:具有操作该视图下所有资源的所有权限。
-
集群管理员:可查看权限范围内的集群、管理集群及集群相关的资源,例如:节点、网络策略、存储类、负载均衡配置等。
-
平台审计人员:可查看平台上所有资源及其审计信息。
常规操作
以下为您说明平台上符合大部分功能操作场景的一些常规操作,方便您后续顺畅地使用平台功能。
常规操作 | 操作步骤 | 补充说明 |
---|---|---|
打开功能入口 | 在左侧导航栏中单击相应的功能菜单项。 | - |
查看资源 |
|
|
创建资源 |
|
创建资源时,通常需要您输入资源相关的参数值,具体请参考功能模块说明文档。 |
更新资源 |
|
更新资源时,通常仅支持更新资源的部分参数信息,不允许更新资源的名称等标识资源关键属性的参数,具体请参考创建操作进行更新。 |
删除资源 |
|
删除资源操作不可逆,请谨慎执行。通常界面会弹出提示要求您进行二次确认,请根据提示执行相应操作即可。 |
功能成熟度说明
平台上的功能,按照成熟度可分为 Alpha 版本、Beta 版本、GA(General Availability)版本。
Beta 版本、GA(General Availability)版本的功能已趋于稳定或正在稳定迭代的过程当中,有专业的团队提供保障和服务,您可以根据实际的需要在生产环境中使用相应的功能。
Alpha 版本的功能,可能存在缺陷或严重 Bug,默认不在生产环境中开启,仅建议在体验或测试平台功能时所搭建的环境部署。
为了方便您区分 Alpha 版本的功能,文档左侧的目录结构中,会以在相应功能模块或具体功能的导航菜单上标注 Alpha
的方式,提示您哪些是 Alpha 版本的功能。例如:创建子网(Alpha)。
平台功能成熟度的说明及建议使用的范围请参见下表。
版本 | 成熟度说明 | 建议使用范围 |
---|---|---|
Alpha | - 可能是有缺陷的,可能包含错误,启用后可能会遇到严重 Bug。 - 支持的功能可能在没有通知的情况下随时删除。 - API、产品场景化封装、交互流程等更改可能会带来兼容性问题,但是,在后续的版本发布时不会特意声明。 - 依赖的 Kubernetes 功能如果是 Alpha 版本,相应的平台功能只能为 Alpha 版本。 |
私有环境部署时,默认关闭 Alpha 版本功能,如果需要,部署时可通过配置相关参数打开。 由于存在 Bugs 风险,同时,可能不会做长期的支持,推荐在短暂的功能体验或测试环境中使用,例如:POC 环境。 |
Beta | - 可能存在缺陷,所有已支持的功能不会被轻易删除。 - API 参数、产品设计细节等可能会随版本迭代发生变化。出现这种情况时,我们将提供迁移到下一个版本的说明。执行编辑操作时需要谨慎操作,可能需要停用依赖该功能的应用程序。 |
默认开启 Beta 版本功能,部署时可通过配置相关参数关闭。 后续版本中可能存在不兼容的更改,建议仅用于非关键型业务运行环境。如果有多个可以独立升级的集群,则可以放宽此限制,在生产环境使用。 |
GA | - 功能的稳定版本,将出现在许多后续版本中。 - API 参数、产品设计细节等可能会随长期支持版本发生变化。出现这种情况时,我们将提供迁移到下一个版本的说明。 |
适用于所有环境,包括生产环境。 |
平台监控数据说明
平台的概览功能将数据以图形化界面的形式,分区展示了资源统计数据和用量统计数据。其中,资源统计数据涵盖了集群、项目、节点、CPU、内存、容器组、用户、角色、命名空间;用量统计数据涵盖了集群资源使用率 Top 5、节点资源使用率 Top 5、资源使用率、容器组数量、告警触发次数。同时,支持以下功能:
-
支持切换时间范围、资源查询范围,精准过滤数据。例如:可展示同类资源在不同时间范围内的数据;可切换集群,查看不同集群的物理资源利用率;
-
支持通过跳转链接快速跳转至监控数据涉及的资源列表或详情页面;
-
支持仅显示异常数据条目并能直接跳转到对应的详情页面。如:跳转到异常项目详情页面。
注意:仅支持查看已部署监控组件集群的概览数据。
在概览页面,可查看资源统计数据部分和用量统计数据部分。以下将结合图示分别说明。
资源统计数据

用量统计数据

监控趋势统计数据说明参见下表。
参数 | 说明 |
---|---|
CPU | 指定时间范围内,CPU 的 使用率、请求率。 使用率 = 集群上所有容器组的 CPU 使用值 / 集群的 CPU 总额。 注意:如果某一段时间集群的 CPU 使用率飙升,您必须首先定位占用 CPU 资源最多的进程。 例如:对于 Java 自定义应用程序,代码中出现内存泄漏或无限循环的情况可能会出现 CPU 使用率飙高。 请求率 = 集群上所有容器组的 CPU 请求值 / 集群的 CPU 总额。 注意:如果某一段时间集群的 CPU 请求率飙升,有可能是集群的超售比设置不合理或集群上运行的 Pod 的请求值设置过高,可能造成资源的浪费。 |
内存 | 指定时间范围内,内存的 使用率、请求率。 使用率 = 集群上所有容器组的内存使用值 / 集群的内存总额。 内存是服务器上的重要部件之一,是与 CPU 通信的桥梁。因此,内存的性能对机器有很大的影响。当程序运行时,数据加载、线程并发和 I/O 缓冲都依赖于内存。可用内存的大小决定了程序是否可以正常运行以及如何运行。 请求率 = 集群上所有容器组的内存请求值 / 集群的内存总额。 注意:如果某一段时间集群的内存请求率飙升,有可能是集群的超售比设置不合理或集群上运行的 Pod 的请求值设置过高,可能造成资源的浪费。 |
容器组数量 | 指定时间范围内,集群中处于运行中状态的容器组数量和所有容器组总数。 |
告警触发次数 | 指定时间范围内,触发的集群相关告警、节点相关告警、计算组件相关告警的个数。 |