全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

监控告警

最近更新时间:2025-08-18 17:29:48

服务监控

在KMR控制台提供了对集群状态和节点状态多维度指标的实时监控和历史监控,如存储、CPU、内存使用率等。您可以根据这些指标实时了解集群服务的运行状况,针对可能存在的风险及时处理,保障集群的稳定运行

操作步骤

  1. 登录金山云KMR控制台

  1. 进入集群详情页面,点击目录左侧导航栏里的集群监控。

  1. 如图是对该集群的监控指标。

监控项指标说明

Zookeper监控项

图表名

描述

活跃节点数

进程存活

节点状态

Zookeeper节点状态

ZNODE个数

当前连接数

ZK连接数

单个客户端与单台服务器之间的连接数的限制,是ip级别的,默认是60,如果设置为0,那么表明不作任何限制

处理请求时延

当前zookeeper延迟状态

排队请求数

排队请求数

接受发送包量

反映ZK接手请求和发送响应包总量

文件描述符数

当前打开文件数量

Kafka_Broker监控项

图标名

描述

Leader个数

该broker上Leader的副本数量

Partition个数

该broker上Partition的副本数量

离线日志目录个数

用来检查是否存在脱机日志目录,异常值非0

低于最小 Isr partition的个数

低于Min Isr partition的个数。

Offline的Partition个数

没有活跃Leader的Partition将彻底不可用,非0为异常值

处于未同步状态的Partition个数

即失效副本的分区数,异常值非0

每秒流量出口字节数

Broker每秒流量出口字节数,反应Kafka网络吞吐性能

每秒流量入口字节数

Broker每秒流量入口字节数,反应Kafka网络吞吐性络吞吐

每秒流量入口条数

Broker每秒流量入口条数,反应Kafka网络吞吐性

每秒请求次数

Broker每秒Fetch请求次数,反应Kafka通信效率

消费堆积量

消费堆积量

Kafka_Topic监控项

图标名

描述

每秒流量出口字节数

Topic每秒流量出口字节数

每秒流量入口字节数

Topic每秒流量入口字节数

每秒流量入口条数

Topic每秒流量入口条数

每秒请求次数

Topic每秒Fetch、Produce请求次数,每秒失败的Fetch、Produce请求次数

消费堆积量

当前topic所有分区消费组未消费消息总和

事件监控

在事件监控里,您可以具体的看到每次变更操作的具体事件名称和状态等等,帮助您更好的了解每个组件的具体变更。同时您也可以选择您所想要查看监控的时间范围,以便更直观的监控每个组件的状态。

字段

说明

事件名称

所发生事件的具体名称

事件描述

所发生事件的具体描述

节点

具体事件变动节点的名称

服务

事件发生的所属服务

组件

事件所属组件

事件级别

分为critical、warning、info三种类别

事件类型

分为Exception 、NodeServiceAborted、Maintenance三种类别

发生时间

事件发生的具体时间

状态

事件发生的具体状态

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈