全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

告警管理

最近更新时间:2024-02-29 11:45:24

告警列表

  1. 登录金山云日志服务Klog控制台

  2. 从控制台进入工程列表,点击某一工程名称,进入该工程的详情页,点击告警管理,进入到告警列表页。

image.png

用户可通过筛选仪表盘、告警状态以及输入告警名称来查询指定的告警。

修改告警状态

在告警列表中的状态一栏,点击禁用或者启动来修改当前告警的状态。 启动状态下,服务会按照执行频率定时执行告警规则。当满足触发告警通知时,以短信、邮件方式实时发送告警消息。 禁用状态下,则不再执行告警规则,也不会触发告警。

新建告警

  • 登录金山云日志服务Klog控制台

  • 从控制台进入工程列表,点击某一工程名称,进入该工程的详情页,点击告警管理,进入到告警列表页。

  • 在告警列表页,点击新建告警,进入到新建告警页面。

    image.png
    • 告警名称:必填项,名称支持2-64个字符,仅允许字母中文数字-_@#.

    • 仪表盘:必选项,选择当前已有仪表盘

    • 关联图表:基于所选图表的数据内容来配置告警出发规则,支持关联同一仪表盘下的多个图表;每个图表具备一个序列号,例如:第一个图表的序列号为0,第二个图表序列号为1,以此类推。

    • 检查频率:该告警执行数据查询的频率,支持固定间隔和crontab模式。其中,固定间隔支持分钟、小时、天粒度的间隔。

      cron表达式说明如下:
      0/5 从0分钟开始,每隔5分钟发送一次
      0 0/1 从0点0分开始,每隔1小时发送一次
      0 18
      每天18点0分发送一次
      0 0 1 每月1日0点0分发送一次

    • 触发条件:通过表达式来设置触发告警的条件,支持加(+)、减(-)、乘(*)、除(/)、4种基础运算符和>、>=、<、<=、==、!= 6种比较运算符,&&、|| 2种逻辑运算

    • 触发次数阈值:触发告警的次数上限,当某次执行中查询到满足表达式的数据,累计1次,当累计值达到触发次数阈值时,会触发告警。

    • 通知间隔:发送告警通知的时间间隔。比如设置5分钟间隔时,会每隔5分钟查看当前累计触发次数是否超出阈值,超出时则发送告警。

  • 点击下一步,设置告警通知方式。

    • 告警通知方式:支持短信、邮件和webhook,按需勾选即可。webhook告警需要填写公网可访问到的 URL 或金山协作、企业微信、钉钉、飞书地址。

    • 选择告警接收组:短信和邮件告警,需要选择告警接收组,告警通知会发送给接受组下的用户。仅webhook告警,无需选择告警接收组。

    • 告警内容:填写报警内容,内容支持使用模板变量。模板变量包括工程${project},触发条件${condition},告警名称${alertname},触发时间${triggertime} ,执行语句${ExecuteQuery}, 执行结果${QueryResult},日志池${Logpoolname}。

修改告警

修改告警后,会按照修改后的告警规则来执行告警判断。修改告警中各项配置项的逻辑请参照上面的创建告警。

告警详情

点击某一告警名称,进入到告警详情页。

image.png
  • 告警统计:告警次数是指昨天触发告警的次数之和;通知成功次数是指昨天告警通知发送成功的次数之和;日环比是昨天跟前天的环比。

  • 告警历史:告警规则执行的历史记录。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈