全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

使用电话接收告警通知

最近更新时间:2026-04-24 10:14:54

托管 Prometheus 服务支持多种类型的告警接收方式,您可以使用手机接收托管 Prometheus 服务中产生的告警。本文将为您介绍使用手机接收告警的操作步骤和注意事项。

1. 仅P0级别的告警支持通过电话接收告警信息。

2. 仅支持中国大陆的手机号,不支持其他国家或地区的手机号。

3. 电话告警当前为白名单功能,如有需要,请发起工单或联系商务进行申请。

前提条件

  1. 已创建托管Prometheus实例,详情参见实例管理

  2. 容器集群或业务已关联托管Prometheus实例,详情参见关联集群

操作步骤

步骤一:进入新建告警策略页

  1. 登录容器服务控制台

  2. 在左侧导航栏中,选择运维管理->Prometheus监控,进入Prometheus控制台。

  3. 在左侧导航栏中,选择监控实例,单击目标监控实例ID,进入详情页,顶部导航栏选择告警,单击新建告警策略

步骤二:配置告警规则

告警规则可选择通过模版导入或新建,告警规则参数说明如下:

参数名称

说明

示例

规则模版名称

告警规则模版的名称,必填。

kubernetes工作负载

模版描述

对模版进行描述。

规则名称

规则的名称,模版内支持创建多条规则,必填。

pod状态异常

PromQL

使用PromQL表达式设置告警触发条件,必填。

sum by (cluster,namespace, pod) ( max by(cluster,namespace, pod) ( kube_pod_status_phase{job="kube-state-metrics", phase=~"Pending|Unknown|Failed"} ) * on(cluster,namespace, pod) group_left(owner_kind) topk by(cluster,namespace, pod) ( 1, max by(cluster,namespace, pod, owner_kind) (kube_pod_owner{owner_kind!="Job"}) ) ) > 0

告警内容

用户收到的告警信息,您可以使用Go template语法在告警内容中自定义告警参数变量,必填。

集群 {{ $labels.cluster }}/namespace {{ $labels.namespace }}/Pod {{ $labels.pod }}处于NotReady状态超过15分钟

Labels

附加到告警上的一组键值对标签,用于标识告警的属性。
单击 添加一行,配置告警规则的 Label,其中:

  • Key:字符串形式,支持字母、数字、下划线_,需以字母或下划线_开头,取值范围为 1~256 个字符。

  • Value:字符串形式,取值范围为 1~256 个字符。

Anntation

用于提供用户可读的描述信息。

单击 添加一行,配置告警规则的 Anntation,Anntation 由 Key 和 Value 组成。其中:

  • Key:字符串形式,支持字母、数字、下划线_,需以字母或下划线_开头,取值范围为 1~256 个字符。

  • Value:字符串形式,取值范围为 1~256 个字符。

持续时间

当触发条件持续多少时间后才发送告警。

5分钟

告警等级

告警级别,等级包括:p0:严重、p1:紧急、p2:重要、P3:通知,数值越小等级越高。

p0

步骤三:配置通知策略

通知策略支持通过模版导入或新建,通知策略参数说明如下:

参数名称

说明

示例

策略名称

自定义通知策略名称

test

通知时间

设置可发送通知的时间段

00:00-23:59

通知对象

接收告警的通知对象,其中用户、用户组、值班表均支持使用电话通知

通知对象类型:用户

通知对象:用户A

通知方式

接收告警的方式

电话

告警恢复通知

配置当告警恢复时是否进行通知

不发送恢复通知

告警通知举例说明:

  • 告警策略1:

    • 规则A:P0

    • 规则B:P1

    • 通知方式:电话 + 短信 + 邮件

  • 告警触发后进行通知:

    • 规则A(P0):通过 电话 + 短信 + 邮件 进行通知

    • 规则B(P1):通过 短信 + 邮件(不触发电话)进行通知

1. 仅p0级别的告警支持通过电话接收告警信息,建议您不要将电话设置为唯一的通知方式。

2. 进行通知策略配置前,请确保已完成用户联系方式配置及验证,否则将无法接收告警。新增用户或验证用户联系方式请前往访问控制

步骤四(可选):配置升级策略

对于长期未解决的告警,可以选择升级通知来提醒联系人及时解决。升级策略支持通过模版导入或新建,参数说明如下:

参数名称

说明

示例

策略名称

自定义升级策略名称

test

升级阈值

指告警在触发后,持续未恢复状态(firing)达到指定时间则进行升级通知

10min

通知时间

设置可发送通知的时

通知对象

接收告警的通知对象,其中用户、用户组、值班表均支持使用电话通知

通知对象类型:用户

通知对象:用户A

通知方式

接收告警的方式

电话

步骤五:设置收敛时间

设置告警通知发送后的抑制窗口,限制在告警持续(Firing状态)期间的重复通知频率。如收敛时间设置为5分钟,则表示在5分钟内如果多次满足告警条件,仅发送一次告警通知。

去重说明

为避免重复通知对用户造成干扰,托管Prometheus服务在告警通知与升级触发场景中提供统一的去重机制,具体规则如下:

  1. 相同升级策略去重

当存在多条升级策略,且其通知方式、升级阈值等配置完全一致时:系统将自动进行去重处理,在同一时间点,仅发送一次通知,避免因策略重复配置导致的多次触达

  1. 通知与升级重叠去重

当通知策略与升级策略中包含相同接收人,且在同一时刻同时满足触发条件时:系统仅向该接收人发送一次通知,不会重复发送。

告警通知与告警升级的邮件、短信、电话内容相同。

告警+升级触发举例说明:

配置如下:

  • 告警通知:持续 2 分钟触发

  • 升级策略:持续 5 分钟触发

  • 收敛时间:8 分钟

  • 通知方式:邮件

  • 接收人:均包含用户A

触发过程:

  • 00:00:告警首次满足条件

  • 00:02:满足“持续 2 分钟”条件
    → 对通知策略中所有通知对象均发送 1 次告警通知邮件(此时未满足升级条件)

  • 00:10:(00:00-00:10时间段内一直持续告警未解决)

    • 告警通知条件:持续告警2分钟条件满足,00:10在新一轮通知周期(00:08-00:16)中,

    • 升级触发条件:持续告警5分钟条件满足,00:10在新一轮通知周期(00:08-00:16)中,

    →对于同一接收人用户A:系统仅发送 1 封邮件,不重复发送通知与升级邮件

    →对于升级策略中其他通知对象:系统仅发送1封邮件

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈