最近更新时间:2026-05-06 14:23:28
托管Prometheus服务支持使用飞书接收告警通知,本文将为您介绍配置方式及注意事项。
使用您的账号登录飞书,创建或者找到需要接收告警的群组,单击群组右上角...,下拉菜单中选择 设置>群机器人>自定义机器人。
完成自定义机器人的信息配置,单击保存,获得并复制Webhook地址,后续告警配置将使用该地址。
飞书自定义机器人的更多配置及说明,请参见 飞书官方文档。
登录容器服务控制台。
在左侧导航栏中,选择运维管理->Prometheus监控,进入Prometheus监控实例页面。
在托管Prometheus控制台左侧导航栏中,选择告警模版管理>通知策略模版,单击新建,配置通知策略。其中:
通知对象选择 办公平台>飞书。
在飞书配置文本框中,粘贴步骤一复制的Webhook地址。
(可选)在需要@的人文本框内,输入告警时需要@的人员ID,并单击回车键确认。飞书 UserID 的获取方式:登录飞书>工作台>飞书人事>花名册>单击目标用户头像查看UID。
单击验证,确认托管 Prometheus 服务和飞书自定义机器人的连通性。当验证成功时,机器人会在群组中给出连通成功的提示。
单击确定,完成配置。
在托管Prometheus控制台左侧导航栏中,选择监控实例,单击目标托管Prometheus实例ID,进入实例详情页。
选择告警,单击新建告警策略,其中告警规则可选择通过模版导入或新建,告警规则参数说明如下:
参数名称 | 说明 | 示例 |
|---|---|---|
规则模版名称 | 告警规则模版的名称,必填。 | kubernetes工作负载 |
模版描述 | 对模版进行描述。 | 无 |
规则名称 | 规则的名称,模版内支持创建多条规则,必填。 | pod状态异常 |
PromQL | 使用PromQL表达式设置告警触发条件,必填。 | sum by (cluster,namespace, pod) ( max by(cluster,namespace, pod) ( kube_pod_status_phase{job="kube-state-metrics", phase=~"Pending|Unknown|Failed"} ) * on(cluster,namespace, pod) group_left(owner_kind) topk by(cluster,namespace, pod) ( 1, max by(cluster,namespace, pod, owner_kind) (kube_pod_owner{owner_kind!="Job"}) ) ) > 0 |
告警内容 | 用户收到的告警信息,您可以使用Go template语法在告警内容中自定义告警参数变量,必填。 | 集群 {{ $labels.cluster }}/namespace {{ $labels.namespace }}/Pod {{ $labels.pod }}处于NotReady状态超过15分钟 |
Labels | 附加到告警上的一组键值对标签,用于标识告警的属性。
| 无 |
Anntation | 用于提供用户可读的描述信息。 单击 添加一行,配置告警规则的 Anntation,Anntation 由 Key 和 Value 组成。其中:
| 无 |
持续时间 | 当触发条件持续多少时间后才发送告警。 | 5分钟 |
告警等级 | 告警级别,数值越小等级越高。 | p0 |
在新建告警策略页,完成通知策略配置,选择步骤二中创建的通知策略。
单击确认,完成告警配置。
告警相关的配置完成后,当有符合告警规则的告警触发时,将向飞书群发送告警通知,此时,您可以在群组中收到告警通知的详情。
告警状态说明:firing:告警触发;resolved:告警恢复。
纯净模式
