告警设置
支持为不同级别的告警配置全局发送间隔,以限制发送消息频率,同时,支持为内置的监控组件配置告警通知策略,当检测到自身组件异常时触发告警并通知,方便用户了解内置告警组件状态。
监控组件异常告警
支持为 Prometheus、VictoriaMetrics、Alertmanager 告警组件配置异常告警检查和通知,帮助用户在发现任何问题后予以确认和纠正。
-
在左侧导航栏中,单击 运维中心 > 告警 > 告警设置。
-
在 监控组件异常告警 区域,单击 更新。
参数 描述 检查间隔 告警发送间隔是指,告警触发后还未恢复正常,间隔多久重复发送一次告警消息。 通知间隔 发送通知的时间间隔,通知间隔不允许小于检查间隔。 不检测集群 平台默认检查所有集群的告警组件状态,可添加无需检测的集群,添加够后该集群的监控组件将不被检查。 通知策略 为告警组件添加通知策略,方便用户快速发现监控组件问题。 -
单击 确定。
更新告警发送间隔(全局)
管理员根据实际情况,可以设置全局的告警发送间隔时间,支持灵活地为不同级别的告警设置不同的间隔时间。
-
在左侧导航栏中,单击 运维中心 > 告警 > 告警设置。
-
在 告警发送间隔 区域,查看不同级别告警对应的告警发送间隔。告警发送间隔是指,告警触发后还未恢复正常,间隔多久重复发送一次告警消息。平台提供默认值,在默认情况下,灾难告警的发送间隔为 5 分钟;严重告警的发送间隔为 15 分钟,警告告警的发送间隔为 30 分钟,提示告警的发送间隔为 1 小时。
-
单击 更新,在 更新告警发送间隔 窗口,可更新不同级别告警对应的告警发送间隔。支持选择 5 分钟、10 分钟、15 分钟、30 分钟、1 小时、3 小时、6 小时、12 小时、1 天、不重复。如设置为不重复,则只会在告警和恢复时发送告警消息。
-
更新完成后,单击 更新。设置完成后,用户在创建告警模板或告警策略时,可选择使用全局的告警发送间隔时间。