首页 / 平台管理 / 运维中心 / 告警 / 告警设置

告警设置

支持为不同级别的告警配置全局发送间隔,以限制发送消息频率,同时,支持为内置的监控组件配置告警通知策略,当检测到自身组件异常时触发告警并通知,方便用户了解内置告警组件状态。

监控组件异常告警

支持为 Prometheus、VictoriaMetrics、Alertmanager 告警组件配置异常告警检查和通知,帮助用户在发现任何问题后予以确认和纠正。

  1. 在左侧导航栏中,单击 运维中心 > 告警 > 告警设置

  2. 监控组件异常告警 区域,单击 更新

    参数 描述
    检查间隔 告警发送间隔是指,告警触发后还未恢复正常,间隔多久重复发送一次告警消息。
    通知间隔 发送通知的时间间隔,通知间隔不允许小于检查间隔。
    不检测集群 平台默认检查所有集群的告警组件状态,可添加无需检测的集群,添加够后该集群的监控组件将不被检查。
    通知策略 为告警组件添加通知策略,方便用户快速发现监控组件问题。
  3. 单击 确定

更新告警发送间隔(全局)

管理员根据实际情况,可以设置全局的告警发送间隔时间,支持灵活地为不同级别的告警设置不同的间隔时间。

  1. 在左侧导航栏中,单击 运维中心 > 告警 > 告警设置

  2. 告警发送间隔 区域,查看不同级别告警对应的告警发送间隔。告警发送间隔是指,告警触发后还未恢复正常,间隔多久重复发送一次告警消息。平台提供默认值,在默认情况下,灾难告警的发送间隔为 5 分钟;严重告警的发送间隔为 15 分钟,警告告警的发送间隔为 30 分钟,提示告警的发送间隔为 1 小时。

  3. 单击 更新,在 更新告警发送间隔 窗口,可更新不同级别告警对应的告警发送间隔。支持选择 5 分钟、10 分钟、15 分钟、30 分钟、1 小时、3 小时、6 小时、12 小时、1 天、不重复。如设置为不重复,则只会在告警和恢复时发送告警消息。

  4. 更新完成后,单击 更新。设置完成后,用户在创建告警模板或告警策略时,可选择使用全局的告警发送间隔时间。