全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

KMR

最近更新时间:2023-11-27 10:27:47

KMR

KMR集群
监控指标 描述 单位
namenode_connection_load 当前连接数
namenode_volume_failures_total Datanodes的全故障总数
namenode_blocks_total 总BLOCK数量
namenode_under_replicated_blocks 副本数不够的块数量
namenode_capacity_utilization HDFS空间利用率 %
namenode_capacity_total 集群存储总容量 GB
namenode_capacity_used 集群存储已使用容量 GB
namenode_capacity_used_non_dfs 集群非HDFS使用容量 bytes
namenode_capacity_remaining 集群存储剩余容量 GB
namenode_files_total 总文件数量
namenode_num_dead_data_nodes 已经标记为Dead状态的数据节点数量
namenode_num_live_data_nodes 活的数据节点数量
namenode_num_decommissioning_data_nodes 正在下线的节点数量
namenode_corrupt_blocks 坏块数量
resourcemanager_app_failures 失败application百分比 %
resourcemanager_apps_running 正在运行的application个数
resourcemanager_apps_submitted 应用提交个数
resourcemanager_apps_pending 挂起的application个数
resourcemanager_apps_completed 完成的application个数
resourcemanager_apps_killed 被杀死的application个数
resourcemanager_apps_failed 失败的application个数
resourcemanager_cluster_memory 集群内存利用率 %
resourcemanager_mem_allocated 已分配的内存量 MB
resourcemanager_mem_reserved 预留内存量 MB
resourcemanager_mem_available 可用内存量 MB
resourcemanager_vcores_allocated 使用的VCore数目
resourcemanager_vcores_available 可用的VCore数目
resourcemanager_cluster_cpu 集群CPU利用率 %
resourcemanager_allocated_containers 已分配容器数
resourcemanager_pending_containers 挂起容器个数
resourcemanager_reserved_containers 预留容器数
resourcemanager_active_nms 集群节点存活数量
resourcemanager_decommissioned_nms 已退役节点数量
resourcemanager_lost_nms 丢失节点数量
resourcemanager_unhealthy_nms 非健康节点数量
presto_active_workers 活跃的worker数
presto_failed_workers 失败worker数量
presto_total_workers 总worke数量
presto_running_queries 正在运行的查询总数
presto_queued_queries 等待状态的查询总数
presto_failedqueries_oneminute_count 失败的查询总数 个/min
presto_abandonedqueries_oneminute_count 放弃的查询总数 个/min
presto_canceledqueries_oneminute_count 取消的查询总数 个/min
presto_completedqueries_oneminute_count 完成的查询总数 个/min
presto_startedqueries_oneminute_count 已启动的查询总数 个/min
presto_submittedqueries_oneminute_count 已提交的查询总数 个/min
presto_inputdatasize_oneminute_rate 输入数据速率 bytes
presto_outputdatasize_oneminute_rate 输出数据速率 bytes
presto_reservedistributedbytes 集群中 Reserved Memory 的大小 bytes
presto_totalInputrows 平均处理的输入行数
presto_totalcputimesecs Worker 的并发总数

KMR节点

监控指标 描述 单位
zookeeper_num_alive_connections 当前连接数
zookeeper_znode_count zk的znode数量
zookeeper_avg_latency zk处理平均延迟 ms
zookeeper_max_latency zk处理最大时延 ms
zookeeper_min_latency zk处理最小时延 ms
zookeeper_watch_count zk的watch数目
zookeeper_packets_received zk接收的数据包速率 个/s
zookeeper_packets_sent zk发送的数据包速率 个/s
zookeeper_outstanding_requests 排队请求数
zookeeper_server_state zk节点类型 0:unknow1:leader2:follower
zookeeper_process_alive 进程存活 0:不存活1:存活
namenode_process_alive namenode进程存活
datanode_process_alive datanode进程存活
journalnode_process_alive journalnode进程存活
zkfailovercontroller_process_alive zkfailovercontroller进程存活
namenode_gc_count JVMGC次数
namenode_gc_time JVMGC耗时 ms
namenode_mem_heap_used JVM已使用堆内存 MB
namenode_mem_heap_committed JVM可用堆内存 MB
namenode_mem_heap_max JVM最大堆内存 MB
namenode_memory_utilization namenode内存利用率 %
namenode_cpu_utilization namenodeCPU利用率 %
namenode_rpc_processing_time_avg_time RPC请求平均处理时间 ms
namenode_rpc_queue_time_avg_time RPC平均延迟时间 ms
namenode_ha_state NN状态
nodemanager_process_alive nodemanager进程存活
resourcemanager_process_alive resourcemanager进程存活
jobhistoryserver_process_alive jobhistoryserver进程存活
resourcemanager_memory_utilization memory利用率 %
resourcemanager_cpu_utilization CPU利用率 %
resourcemanager_mem_heap_used JVM已使用堆内存 MB
resourcemanager_mem_heap_committed JVM可用堆内存 MB
resourcemanager_mem_heap_max JVM最大堆内存 MB
resourcemanager_sentbytes RPC发送数据量(8032) bytes/s
resourcemanager_receivedbytes RPC接收数据量(8032) bytes/s
metastore_process_alive metastore进程存活
hiveserver2_process_alive hiveserver2进程存活
metastore_process_cpu_load 进程的CPU使用率 %
metastore_mem_heap_used JVM已使用堆内存 MB
metastore_mem_heap_committed JVM可用堆内存 MB
metastore_mem_heap_max JVM最大堆内存 MB
metastore_max_fd_count 最大文件描述符数
metastore_open_fd_count 已打开文件描述符数量
metastore_thread_count metastore总线程数
hiveserver2_mem_heap_used Jhiveserver2JVM已使用堆内存 MB
hiveserver2_mem_heap_committed hiveserver2可用堆内存 MB
hiveserver2_mem_heap_max hiveserver2最大堆内存 MB
hiveserver2_max_fd_count hiveserver2最大文件描述符数
hiveserver2_open_fd_count hiveserver2已打开文件描述符数
hiveserver2_thread_count hiveserver2总线程数
spark_historyserver_process_alive historyserver进程存活
spark_historyserver_jvm_threads_current 已使用线程
spark_historyserver_jvm_threads_daemon JVM守护线程数
spark_historyserver_jvm_classes_loaded JVM已加载类数量
spark_historyserver_process_open_fds 已打开文件描述符数
spark_historyserver_process_max_fds 最大文件描述符数
spark_historyserver_gc_collection_seconds_sum_ms 每次GC总耗时(老年代) s
spark_historyserver_gc_collection_seconds_sum_s 每次GC总耗时(新生代) s
spark_historyserver_gc_collection_seconds_count_ms 每秒GC次数(老年代)
spark_historyserver_gc_collection_seconds_count_s 每秒GC次数(新生代)
spark_historyserver_mem_heap_used JVM已使用堆内存 MB
spark_historyserver_mem_heap_committed JVM可用堆内存 MB
spark_historyserver_mem_heap_max JVM最大堆内存 MB
flink_historyserver_process_alive historyserver进程存活
flink_historyserver_jvm_threads_current 已使用线程
flink_historyserver_jvm_threads_daemon JVM守护线程数
flink_historyserver_jvm_classes_loaded JVM已加载类数量
flink_historyserver_process_open_fds 已打开文件描述符数
flink_historyserver_process_max_fds 最大文件描述符数
flink_historyserver_gc_collection_seconds_sum_ms 每次GC总耗时(老年代) s
flink_historyserver_gc_collection_seconds_sum_s 每次GC总耗时(新生代) s
flink_historyserver_gc_collection_seconds_count_ms 每秒GC次数(老年代)
flink_historyserver_gc_collection_seconds_count_s 每秒GC次数(新生代)
flink_historyserver_mem_heap_used JVM已使用堆内存 MB
flink_historyserver_mem_heap_committed JVM可用堆内存 MB
flink_historyserver_mem_heap_max JVM最大堆内存 MB
prestocoordinator_process_alive coordinator进程存活
prestoworker_process_alive worker进程存活
hue_process_alive hue进程存活
oozie_process_alive oozie进程存活
文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈