赞
踩
kafka1.0.X 官网采集的监控指标:http://kafka.apache.org/0110/documentation.html#monitoring
- ### Kafka性能指标
- #### kafka.server
- BrokerTopicMetrics,name=MessagesInPerSec: 每秒消息量
- BrokerTopicMetrics,name=BytesInPerSec: 每秒输入字节数
- BrokerTopicMetrics,name=BytesOutPerSec: 每秒输出字节数
- ReplicaManager,name=UnderReplicatedPartitions: 复制分区的数量,默认0,|ISR|<|all replicas|
- ReplicaManager,name=PartitionCount: 分区数
- ReplicaManager,name=LeaderCount: Leader副本数
- ReplicaManager,name=IsrShrinksPerSec: ISR回退
- ReplicaManager,name=IsrExpandsPerSec: ISR超前 value is 0
- ReplicaFetcherManager,name=MaxLag,clientId=Replica: 滞后follower和leader的最大消息长度
- FetcherLagMetrics,name=ConsumerLag,clientId=([-.\w]+),topic=([-.\w]+),partition=([0-9]+): 滞后follower的消息长度
- DelayedOperationPurgatory,name=PurgatorySize,delayedOperation=Produce: producer等待请求大小
- DelayedOperationPurgatory,name=PurgatorySize,delayedOperation=Fetch: 获取等待请求大小
- KafkaRequestHandlerPool,name=RequestHandlerAvgIdlePercent: 平均处理线程空闲时间
- #### kafka.network
- kafka.network:type=RequestMetrics,name=$1,request={Produce|FetchConsumer|FetchFollower}
- RequestsPerSec: 每秒请求量
- TotalTimeMs: 请求总时间
- RequestQueueTimeMs: 请求队列等待时间
- LocalTimeMs: 请求leader处理时间
- RemoteTimeMs: 请求follower等待时间
- ResponseQueueTimeMs: 请求队列等待响应时间
- ResponseSendTimeMs: 请求响应发送时间
- kafka.network:type=SocketServer,name=NetworkProcessorAvgIdlePercent: 平均网络处理空闲时间
-
- #### kafka.controller
- KafkaController,name=ActiveControllerCount: 活跃broker数量
- ControllerStats,name=LeaderElectionRateAndTimeMs: leader选举率
- ControllerStats,name=UncleanLeaderElectionsPerSec: Unclean leader选举率
- #### common
- connection-close-rate: 每秒连接关闭率
- connection-creation-rate: 每秒新建连接率
- network-io-rate: 平均每秒IO次数(读取或写入)
- outgoing-byte-rat: 平均每秒向服务器发送的字节数
- request-rate: 平均每秒发送的请求数
- incoming-byte-rate: 每秒读取字节数
- response-rate: 每秒收到的回复
- select-rate: IO切换次数
- io-wait-ratio: IO线程等待时间
- connection-count: 当前活跃连接数
-
- #### broker
- outgoing-byte-rate: 平均每秒发送字节数
- request-rate: 平均每秒请求数
- request-size-avg: 所有请求的平均大小
- request-latency-avg: 平均请求时间(ms)
- response-rate: 每秒收到的响应数
-
- #### producer
- waiting-threads: 缓存区排队的用户阻塞线程数
- buffer-available-bytes: 可用内存字节数
- batch-size-avg: 每个分区每次请求发送的平均字节数
- compression-rate-avg: 批量记录平均压缩率
- record-queue-time-avg: 批量记录耗费的平均时间(ms)
- request-latency-avg: 平均请求时间(ms)
- record-send-rate: 每秒发送的平均次数
- record-retry-rate: 每秒重试发送次数
- record-error-rate: 每秒错误数量次数
- requests-in-flight: 目前等待响应的请求数量
- metadata-age: 当前生产者数据使用周期(s)
-
- #### consumer
- ##### Consumer Group
- commit-latency-avg: 提交请求所用的平均时间
- commit-rate: 每秒提交调用次数
- assigned-partitions: 当前分配给该消费者的分区数(可选)
- heartbeat-rate: 平均每秒心跳数
- join-time-avg: 群组重新加入的平均时间
- join-rate: 每秒连接组的数量
- sync-time-avg: 群组同步所需的平均时间
- sync-rate: 每秒同步的组数
-
- ##### consumer fetch
- fetch-size-avg: 每次请求获取的平均字节数
- bytes-consumed-rate: 每秒消耗的平均字节数
- fetch-latency-avg: 请求所用的平均时间
- fetch-rate: 每秒提取请求数
- records-lag-max: 分区中记录的最大滞后数量
-
- ##### topic-level fetch
- fetch-size-avg: topic请求的平均字节数
- bytes-consumed-rate: topic每秒平均消耗的字节数
- #### streams
- ##### Thread
- [commit|poll|process|punctuate]-latency-avg: 平均执行时间(ms)
- [commit|poll|process|punctuate]-rate: 平均每秒请求数
- task-created-rate: 每秒新建任务数
- task-closed-rate: 每秒关闭任务数
- skipped-records-rate: 每秒跳过记录数
-
- ##### Task
- commit-latency-avg: 平均执行时间(ms)
- commit-rate: 每秒提交的平均次数
- ##### Processor Node
- forward-rate: 每秒从源节点向下游转发的平均速率
- ##### State Store
- [put|put-if-absent|get|delete|put-all|all|range|flush|restore]-latency-avg: 平均执行时间(ns)
- [put|put-if-absent|get|delete|put-all|all|range|flush|restore]-rate: 每秒的平均运行速度
- #### others
- GC、CPU、IO等
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。