跳转至

告警策略


概述

观测云支持对监控器的检测结果进行告警策略管理,通过发送告警通知邮件或者群消息通知,让您及时了解监测的异常数据情况,发现问题,解决问题。

注意:

  • 每个监控器创建时必须选择一个告警策略,默认选中「默认」;
  • 当某个告警策略被删除时,删除告警策略下的监控器将自动归类到「默认」下。

新建告警策略

在观测云工作空间「监控」-「告警策略管理」,点击「新建告警策略」即可添加新的告警策略。可以为告警策略配置告警对象和告警沉默。

1)名称:告警策略的名称。

2)事件通知等级:包括信息、紧急、重要、警告、无数据、恢复、无数据恢复、无数据视为恢复。默认发送所有异常事件告警通知,如有需要可通过列表自定义事件通知等级。

通知对象

3)告警通知对象:告警通知支持选择不同的通知类型,对多个对象发送告警通知。“观测云”支持多种通知类型,包括「空间成员」、「邮件组」、「钉钉机器人」、「企业微信机器人」、「飞书机器人」和「Webhook自定义」。

  • 空间成员:邮件通知,通过在「管理」-「成员管理」,添加通知对象,可参考此文档中的「告警示例」。
  • 邮件组:邮件通知,一个邮件组可添加多个空间成员,通过在「管理」-「通知对象管理 」,添加通知对象。
  • 钉钉机器人、企业微信机器人、飞书机器人:群通知,通过在「管理」-「通知对象管理」,添加通知对象。
  • Webhook自定义:用户自行设定,通过在「管理」-「通知对象管理」,添加通知对象。
  • 短信:短信通知,一个短信组可以添加多个空间成员,通过在「管理」-「通知对象管理」,添加通知对象。“观测云”免费版无短信通知,其他版本短信通知0.1 元 / 条,按天计费,没有免费额度。
Attention
  • 邮件、钉钉、微信、飞书、短信告警通知都是每分钟合并了发送,并不是产生后立刻发送,会存在约一分钟的延迟;
  • 邮件、钉钉、微信、飞书收到的告警通知包含“观测云跳转链接”,点击可直接跳转到对应的观测云事件详情,时间范围为当前时间的往前15分钟,即18:45:00的事件,点击链接后跳转至事件详情页,时间范围固定为4.20 18:30:00 ~ 4.20 18:45:00。

告警沉默

4)告警沉默:若同一个事件不是非常紧急,但是告警通知频率高,可以通过设置告警沉默的方式减少告警通知频率。

Attention

告警沉默后事件会继续产生,但是告警通知不会再发送,产生的事件会存入事件管理

告警策略列表

「告警策略」列表中,保存有当前工作空间内的全部告警策略。支持查看告警策略名称、 关联监控器、告警沉默时间、操作。

查询

告警策略列表支持基于告警策略名称进行搜索。

关联监控器

展示告警策略下的监控器个数,点击个数可以跳转到监控器查看告警策略下的监控器详情。

操作说明

操作 说明
告警配置 点击按钮可以修改当前告警策略
删除 当告警策略被删除时,删除告警策略下的监控器将自动归类到「默认」下

告警示例

1.创建监控器

在「监控」中,新建监控器,点击「+新建监控器」,并选择对应检测规则(如:阈值检测),开始配置检测规则。 配置详情参考 阈值检测

2.配置告警对象

  • 添加告警对象

在「管理」,进入「成员管理」,点击「添加成员」,添加成功后,可用于告警通知的对象。

  • 配置告警对象

在「监控器」,选择指定告警策略进行「告警配置」,并选择相关通知对象和告警沉默,点击「确定」。

3.告警邮件

配置完成告警对象后,即可收到告警邮件。

4.告警事件

在「监控器」,点击「查看相关事件」,即可在「事件」查看对应的告警事件列表。详情参考 事件管理