最近更新时间:2026-04-24 10:14:54
托管 Prometheus 服务支持多种类型的告警接收方式,您可以使用手机接收托管 Prometheus 服务中产生的告警。本文将为您介绍使用手机接收告警的操作步骤和注意事项。
1. 仅P0级别的告警支持通过电话接收告警信息。
2. 仅支持中国大陆的手机号,不支持其他国家或地区的手机号。
3. 电话告警当前为白名单功能,如有需要,请发起工单或联系商务进行申请。
登录容器服务控制台。
在左侧导航栏中,选择运维管理->Prometheus监控,进入Prometheus控制台。
在左侧导航栏中,选择监控实例,单击目标监控实例ID,进入详情页,顶部导航栏选择告警,单击新建告警策略。
告警规则可选择通过模版导入或新建,告警规则参数说明如下:
参数名称 | 说明 | 示例 |
|---|---|---|
规则模版名称 | 告警规则模版的名称,必填。 | kubernetes工作负载 |
模版描述 | 对模版进行描述。 | 无 |
规则名称 | 规则的名称,模版内支持创建多条规则,必填。 | pod状态异常 |
PromQL | 使用PromQL表达式设置告警触发条件,必填。 | sum by (cluster,namespace, pod) ( max by(cluster,namespace, pod) ( kube_pod_status_phase{job="kube-state-metrics", phase=~"Pending|Unknown|Failed"} ) * on(cluster,namespace, pod) group_left(owner_kind) topk by(cluster,namespace, pod) ( 1, max by(cluster,namespace, pod, owner_kind) (kube_pod_owner{owner_kind!="Job"}) ) ) > 0 |
告警内容 | 用户收到的告警信息,您可以使用Go template语法在告警内容中自定义告警参数变量,必填。 | 集群 {{ $labels.cluster }}/namespace {{ $labels.namespace }}/Pod {{ $labels.pod }}处于NotReady状态超过15分钟 |
Labels | 附加到告警上的一组键值对标签,用于标识告警的属性。
| 无 |
Anntation | 用于提供用户可读的描述信息。 单击 添加一行,配置告警规则的 Anntation,Anntation 由 Key 和 Value 组成。其中:
| 无 |
持续时间 | 当触发条件持续多少时间后才发送告警。 | 5分钟 |
告警等级 | 告警级别,等级包括:p0:严重、p1:紧急、p2:重要、P3:通知,数值越小等级越高。 | p0 |
通知策略支持通过模版导入或新建,通知策略参数说明如下:
参数名称 | 说明 | 示例 |
|---|---|---|
策略名称 | 自定义通知策略名称 | test |
通知时间 | 设置可发送通知的时间段 | 00:00-23:59 |
通知对象 | 接收告警的通知对象,其中用户、用户组、值班表均支持使用电话通知 | 通知对象类型:用户 通知对象:用户A |
通知方式 | 接收告警的方式 | 电话 |
告警恢复通知 | 配置当告警恢复时是否进行通知 | 不发送恢复通知 |
告警通知举例说明:
告警策略1:
规则A:P0
规则B:P1
通知方式:电话 + 短信 + 邮件
告警触发后进行通知:
规则A(P0):通过 电话 + 短信 + 邮件 进行通知
规则B(P1):通过 短信 + 邮件(不触发电话)进行通知
1. 仅p0级别的告警支持通过电话接收告警信息,建议您不要将电话设置为唯一的通知方式。
2. 进行通知策略配置前,请确保已完成用户联系方式配置及验证,否则将无法接收告警。新增用户或验证用户联系方式请前往访问控制。
对于长期未解决的告警,可以选择升级通知来提醒联系人及时解决。升级策略支持通过模版导入或新建,参数说明如下:
参数名称 | 说明 | 示例 |
|---|---|---|
策略名称 | 自定义升级策略名称 | test |
升级阈值 | 指告警在触发后,持续未恢复状态(firing)达到指定时间则进行升级通知 | 10min |
通知时间 | 设置可发送通知的时 | |
通知对象 | 接收告警的通知对象,其中用户、用户组、值班表均支持使用电话通知 | 通知对象类型:用户 通知对象:用户A |
通知方式 | 接收告警的方式 | 电话 |
设置告警通知发送后的抑制窗口,限制在告警持续(Firing状态)期间的重复通知频率。如收敛时间设置为5分钟,则表示在5分钟内如果多次满足告警条件,仅发送一次告警通知。
为避免重复通知对用户造成干扰,托管Prometheus服务在告警通知与升级触发场景中提供统一的去重机制,具体规则如下:
相同升级策略去重
当存在多条升级策略,且其通知方式、升级阈值等配置完全一致时:系统将自动进行去重处理,在同一时间点,仅发送一次通知,避免因策略重复配置导致的多次触达
通知与升级重叠去重
当通知策略与升级策略中包含相同接收人,且在同一时刻同时满足触发条件时:系统仅向该接收人发送一次通知,不会重复发送。
告警通知与告警升级的邮件、短信、电话内容相同。
告警+升级触发举例说明:
配置如下:
告警通知:持续 2 分钟触发
升级策略:持续 5 分钟触发
收敛时间:8 分钟
通知方式:邮件
接收人:均包含用户A
触发过程:
00:00:告警首次满足条件
00:02:满足“持续 2 分钟”条件
→ 对通知策略中所有通知对象均发送 1 次告警通知邮件(此时未满足升级条件)
00:10:(00:00-00:10时间段内一直持续告警未解决)
告警通知条件:持续告警2分钟条件满足,00:10在新一轮通知周期(00:08-00:16)中,
升级触发条件:持续告警5分钟条件满足,00:10在新一轮通知周期(00:08-00:16)中,
→对于同一接收人用户A:系统仅发送 1 封邮件,不重复发送通知与升级邮件
→对于升级策略中其他通知对象:系统仅发送1封邮件
纯净模式
