모니터링을 위한 아마존 MSK 지표 CloudWatch - Amazon Managed Streaming for Apache Kafka

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

모니터링을 위한 아마존 MSK 지표 CloudWatch

Amazon MSK는 Amazon과 CloudWatch 통합되므로 Amazon MSK 클러스터에 대한 CloudWatch 지표를 수집, 확인 및 분석할 수 있습니다. MSK 클러스터에 대해 구성한 메트릭은 자동으로 수집되어 푸시됩니다 CloudWatch. MSK 클러스터의 모니터링 수준을DEFAULT,PER_BROKERPER_TOPIC_PER_BROKER, 또는 다음 중 하나로 설정할 수PER_TOPIC_PER_PARTITION 있습니다. 다음 섹션의 표에는 각 모니터링 수준에서 시작하여 사용할 수 있는 모든 지표가 나와 있습니다.

DEFAULT-레벨 메트릭은 무료입니다. 다른 메트릭의 가격은 Amazon CloudWatch 요금 페이지에 설명되어 있습니다.

DEFAULT레벨 모니터링

다음 표에 설명된 지표는 DEFAULT 모니터링 수준에서 사용할 수 있습니다. 무료로 제공됩니다.

DEFAULT 모니터링 수준에서 사용 가능한 지표
이름 보이는 경우 Dimensions 설명
ActiveControllerCount 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름 클러스터당 하나의 컨트롤러만 지정된 시간에 활성화되어야 합니다.
BurstBalance

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

클러스터의 EBS 볼륨에 대한 나머지 입력-출력 버스트 크레딧 잔액입니다. 이를 사용하여 지연 시간 또는 처리량 감소를 조사할 수 있습니다.

BurstBalance볼륨의 기준 성능이 최대 버스트 성능보다 높으면 EBS 볼륨에 대해서는 보고되지 않습니다. 자세한 내용은 I/O 크레딧 및 버스트 성능을 참조하세요.

BytesInPerSec 주제를 생성한 후. 클러스터 이름, 브로커 ID, 주제 클라이언트로부터 받은 초당 바이트 수입니다. 이 지표는 브로커별 및 주제별로도 제공됩니다.
BytesOutPerSec 주제를 생성한 후. 클러스터 이름, 브로커 ID, 주제 클라이언트에 전송된 초당 바이트 수입니다. 이 지표는 브로커별 및 주제별로도 제공됩니다.
ClientConnectionCount 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID, 클라이언트 인증 인증된 활성 클라이언트 연결 수입니다.
ConnectionCount 클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

인증된 활성 연결, 인증되지 않은 연결 및 브로커 간 연결 수입니다.
CPUCreditBalance

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

이 메트릭은 브로커의 CPU 크레딧 밸런스를 모니터링하는 데 도움이 될 수 있습니다. CPU 사용량이 기준 수준인 20% 사용률 이상으로 유지되면 CPU 크레딧 밸런스가 고갈되어 클러스터 성능에 부정적인 영향을 미칠 수 있습니다. CPU 부하를 줄이기 위한 조치를 취할 수 있습니다. 예를 들어 클라이언트 요청 수를 줄이거나 브로커 유형을 M5 브로커 유형으로 업데이트할 수 있습니다.

CpuIdle 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID CPU 유휴 시간의 백분율입니다.
CpuIoWait 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 보류 중인 디스크 작업 중 CPU 유휴 시간의 백분율입니다.
CpuSystem 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 커널 공간에 있는 CPU의 백분율입니다.
CpuUser 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 사용자 공간에 있는 CPU의 백분율입니다.
GlobalPartitionCount 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름 복제본을 제외한 클러스터의 모든 주제에 대한 파티션 수입니다. 복제본을 포함하지GlobalPartitionCount 않기 때문에 항목의 복제 인자가 1보다 큰 GlobalPartitionCount 경우보다PartitionCount 값의 합이 더 클 수 있습니다.
GlobalTopicCount 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름 클러스터의 모든 브로커에 있는 총 주제 수입니다.
EstimatedMaxTimeLag 소비자 그룹이 주제를 소비한 후. 소비자 그룹, 주제 배수까지 걸리는 예상 시간 (초)MaxOffsetLag 입니다.
KafkaAppLogsDiskUsed 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 애플리케이션 로그에 사용된 디스크 공간의 백분율입니다.
KafkaDataLogsDiskUsed(Cluster Name, Broker ID치수) 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 데이터 로그에 사용된 디스크 공간의 백분율입니다.
KafkaDataLogsDiskUsed(Cluster Name치수) 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름 데이터 로그에 사용된 디스크 공간의 백분율입니다.
LeaderCount 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커당 파티션의 총 리더 수 (복제본 제외).
MaxOffsetLag 소비자 그룹이 주제를 소비한 후. 소비자 그룹, 주제 토픽의 모든 파티션에 걸친 최대 오프셋 지연입니다.
MemoryBuffered 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에 대한 버퍼링된 메모리의 크기(바이트)입니다.
MemoryCached 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에 대한 캐시 메모리의 크기(바이트)입니다.
MemoryFree 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에 사용할 수 있는 메모리의 크기(바이트)입니다.
HeapMemoryAfterGC

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

가비지 컬렉션 이후 사용 중인 총 힙 메모리의 백분율입니다.
MemoryUsed 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에서 사용 중인 메모리의 크기(바이트)입니다.
MessagesInPerSec 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커의 초당 수신 메시지 수입니다.
NetworkRxDropped 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 삭제된 수신 패키지의 수입니다.
NetworkRxErrors 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에 대한 네트워크 수신 오류 수입니다.
NetworkRxPackets 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에서 수신된 패킷 수입니다.
NetworkTxDropped 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 삭제된 전송 패키지의 수입니다.
NetworkTxErrors 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커의 네트워크 전송 오류 수입니다.
NetworkTxPackets 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커가 전송한 패킷 수입니다.
OfflinePartitionsCount 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름 클러스터에서 오프라인 상태인 총 파티션 수입니다.
PartitionCount 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 복제본을 포함한 브로커당 총 토픽 파티션 수입니다.
ProduceTotalTimeMsMean 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 밀리초 단위의 평균 생산 시간.
RequestBytesMean 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에 대한 요청 바이트의 평균 수입니다.
RequestTime 요청 조절이 적용된 후. 클러스터 이름, 브로커 ID 브로커 네트워크 및 I/O 스레드가 요청을 처리하는 데 소비한 평균 시간(밀리초)입니다.
RootDiskUsed 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커가 사용하는 루트 디스크의 백분율입니다.
SumOffsetLag 소비자 그룹이 주제를 소비한 후. 소비자 그룹, 주제 토픽의 모든 파티션에 대한 집계된 오프셋 지연입니다.
SwapFree 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에서 사용할 수 있는 스왑 메모리의 크기(바이트)입니다.
SwapUsed 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에서 사용 중인 스왑 메모리의 크기(바이트)입니다.
TrafficShaping

클러스터가 ACTIVE 상태에 도달한 후.

클러스터 이름, 브로커 ID

네트워크 할당 초과로 인해 셰이프된 (삭제 또는 대기 중인) 패킷 수를 나타내는 상위 수준 메트릭입니다. PER_BROKER 메트릭을 사용하면 더 자세한 내용을 확인할 수 있습니다.

UnderMinIsrPartitionCount 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커의 minIsr 파티션 수입니다.
UnderReplicatedPartitions 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커에 대해 복제가 덜 진행된 파티션 수입니다.
ZooKeeperRequestLatencyMsMean 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커의 Apache ZooKeeper 요청에 대한 평균 지연 시간 (밀리초) 입니다.
ZooKeeperSessionState 클러스터가 ACTIVE 상태에 도달한 후. 클러스터 이름, 브로커 ID 브로커 ZooKeeper 세션의 연결 상태는 다음 중 하나일 수 있습니다. NOT_CONNECTED: '0.0', 연결: '0.5', CONNECTEDREADONLY: '0.8', 연결됨: '1.0', 닫힘: '5.0', AUTH_FAILED: '10.0'.

PER_BROKER레벨 모니터링

모니터링 수준을 PER_BROKER로 설정하면 모든 DEFAULT 수준 지표 외에 다음 표에 설명된 지표가 표시됩니다. 다음 표의 지표에 해당하는 비용을 지불하지만 DEFAULT 수준 지표는 계속 무료로 제공됩니다. 이 표에 있는 지표의 차원은 클러스터 이름, 브로커 ID입니다.

PER_BROKER 모니터링 수준부터 사용할 수 있는 추가 지표
이름 보이는 경우 설명
BwInAllowanceExceeded 클러스터가 ACTIVE 상태에 도달한 후.

인바운드 집계 대역폭이 브로커의 최대값을 초과하여 형성된 패킷 수입니다.

BwOutAllowanceExceeded 클러스터가 ACTIVE 상태에 도달한 후.

아웃바운드 집계 대역폭이 브로커의 최대값을 초과하여 형성된 패킷 수입니다.

ConnTrackAllowanceExceeded 클러스터가 ACTIVE 상태에 도달한 후.

연결 추적이 브로커의 최대값을 초과하여 형성된 패킷 수입니다. 연결 추적은 설정된 각 연결을 추적하여 반환 패킷이 예상대로 전달되는지 확인하는 보안 그룹과 관련이 있습니다.

ConnectionCloseRate 클러스터가 ACTIVE 상태에 도달한 후.

리스너당 초당 닫힌 연결 수입니다. 이 수는 리스너별로 집계되고 클라이언트 리스너에 대해 필터링됩니다.

ConnectionCreationRate 클러스터가 ACTIVE 상태에 도달한 후.

리스너당 초당 새 연결의 수입니다. 이 수는 리스너별로 집계되고 클라이언트 리스너에 대해 필터링됩니다.

CpuCreditUsage 클러스터가 ACTIVE 상태에 도달한 후.

이 지표는 인스턴스의 CPU 크레딧 사용량을 모니터링하는 데 도움이 될 수 있습니다. CPU 사용량이 기준 수준인 20% 이상으로 유지되면 CPU 크레딧 밸런스가 고갈되어 클러스터 성능에 부정적인 영향을 미칠 수 있습니다. 이 지표를 모니터링하고 경보를 울려 수정 조치를 취할 수 있습니다.

FetchConsumerLocalTimeMsMean 생산자/소비자가 만들어진 이후. 소비자 요청이 리더에서 처리되는 평균 시간(밀리초)입니다.
FetchConsumerRequestQueueTimeMsMean 생산자/소비자가 만들어진 이후. 소비자 요청이 요청 대기열에서 대기하는 평균 시간(밀리초)입니다.
FetchConsumerResponseQueueTimeMsMean 생산자/소비자가 만들어진 이후. 소비자 요청이 응답 대기열에서 대기하는 평균 시간(밀리초)입니다.
FetchConsumerResponseSendTimeMsMean 생산자/소비자가 만들어진 이후. 소비자가 응답을 보내는 평균 시간(밀리초)입니다.
FetchConsumerTotalTimeMsMean 생산자/소비자가 만들어진 이후. 소비자가 브로커에서 데이터를 가져오는 데 소요하는 평균 총 시간(밀리초)입니다.
FetchFollowerLocalTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어 요청이 리더에서 처리되는 평균 시간(밀리초)입니다.
FetchFollowerRequestQueueTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어 요청이 요청 대기열에서 대기하는 평균 시간(밀리초)입니다.
FetchFollowerResponseQueueTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어 요청이 응답 대기열에서 대기하는 평균 시간(밀리초)입니다.
FetchFollowerResponseSendTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어가 응답을 보내는 평균 시간(밀리초)입니다.
FetchFollowerTotalTimeMsMean 생산자/소비자가 만들어진 이후. 팔로어가 브로커에서 데이터를 가져오는 데 소비하는 평균 총 시간(밀리초)입니다.
FetchMessageConversionsPerSec 주제를 생성한 후. 브로커의 초당 가져오기 메시지 변환 횟수입니다.
FetchThrottleByteRate 대역폭 조절이 적용된 후. 초당 병목 현상 바이트 수입니다.
FetchThrottleQueueSize 대역폭 조절이 적용된 후. 조절 대기열에 있는 메시지 수입니다.
FetchThrottleTime 대역폭 조절이 적용된 후. 평균 가져오기 조절 시간(밀리초)입니다.
NetworkProcessorAvgIdlePercent 클러스터가 ACTIVE 상태에 도달한 후. 네트워크 프로세서가 유휴 상태인 시간의 평균 백분율입니다.
PpsAllowanceExceeded 클러스터가 ACTIVE 상태에 도달한 후.

양방향 PPS가 브로커의 최대값을 초과하여 형성된 패킷 수입니다.

ProduceLocalTimeMsMean 클러스터가 ACTIVE 상태에 도달한 후. 요청이 리더에서 처리되는 평균 시간 (밀리초) 입니다.
ProduceMessageConversionsPerSec 주제를 생성한 후. 브로커의 초당 생산 메시지 변환 수입니다.
ProduceMessageConversionsTimeMsMean 클러스터가 ACTIVE 상태에 도달한 후. 메시지 형식 변환에 소요된 평균 시간(밀리초)입니다.
ProduceRequestQueueTimeMsMean 클러스터가 ACTIVE 상태에 도달한 후. 요청 메시지가 대기열에 소비하는 평균 시간(밀리초)입니다.
ProduceResponseQueueTimeMsMean 클러스터가 ACTIVE 상태에 도달한 후. 응답 메시지가 대기열에서 소비하는 평균 시간(밀리초)입니다.
ProduceResponseSendTimeMsMean 클러스터가 ACTIVE 상태에 도달한 후. 응답 메시지를 보내는 데 소비한 평균 시간(밀리초)입니다.
ProduceThrottleByteRate 대역폭 조절이 적용된 후. 초당 병목 현상 바이트 수입니다.
ProduceThrottleQueueSize 대역폭 조절이 적용된 후. 조절 대기열에 있는 메시지 수입니다.
ProduceThrottleTime 대역폭 조절이 적용된 후. 평균 생산 조절 시간(밀리초)입니다.
ProduceTotalTimeMsMean 클러스터가 ACTIVE 상태에 도달한 후. 밀리초 단위의 평균 생산 시간.

RemoteBytesInPerSec

생산자/소비자가 있는 다음이죠.

소비자 패치에 대한 응답으로 계층형 스토리지에서 전송된 총 바이트 수입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 기여하는 모든 토픽 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.

RemoteBytesOutPerSec

생산자/소비자가 있는 다음이죠.

로그 세그먼트, 인덱스 및 기타 보조 파일의 데이터를 포함하여 계층형 스토리지로 전송된 총 바이트 수입니다. 이 지표에는 업스트림 데이터 전송 트래픽에 기여하는 모든 토픽 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.

RemoteLogManagerTasksAvgIdlePercent

클러스터가 ACTIVE 상태에 도달한 후.

원격 로그 관리자가 유휴 상태로 보낸 평균 시간 비율입니다. 원격 로그 관리자는 브로커의 데이터를 계층형 스토리지로 전송합니다. 카테고리: 내부 활동. 이것은 KIP-405 메트릭입니다.
RemoteLogReaderAvgIdlePercent

클러스터가 ACTIVE 상태에 도달한 후.

원격 로그 리더가 유휴 상태로 보낸 평균 시간 비율입니다. 원격 로그 판독기는 소비자 가져오기에 응답하여 원격 스토리지에서 브로커로 데이터를 전송합니다. 카테고리: 내부 활동. 이것은 KIP-405 메트릭입니다.
RemoteLogReaderTaskQueueSize

클러스터가 ACTIVE 상태에 도달한 후.

스케줄링 대기 중인 계층형 스토리지에서 읽기를 담당하는 작업 수입니다. 카테고리: 내부 활동. 이것은 KIP-405 메트릭입니다.
RemoteReadErrorPerSec

클러스터가 ACTIVE 상태에 도달한 후.

지정된 브로커가 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 계층형 스토리지로 보낸 읽기 요청에 대한 응답의 총 오류 비율입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 기여하는 모든 주제 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.
RemoteReadRequestsPerSec

클러스터가 ACTIVE 상태에 도달한 후.

특정 브로커가 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 계층형 스토리지로 보낸 총 읽기 요청 수입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 기여하는 모든 주제 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.
RemoteWriteErrorPerSec

클러스터가 ACTIVE 상태에 도달한 후.

지정된 브로커가 데이터를 업스트림으로 전송하기 위해 계층형 스토리지로 보낸 쓰기 요청에 대한 응답의 총 오류 비율입니다. 이 지표에는 업스트림 데이터 전송 트래픽에 기여하는 모든 주제 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.
ReplicationBytesInPerSec 주제를 생성한 후. 다른 브로커로부터 수신된 초당 바이트 수
ReplicationBytesOutPerSec 주제를 생성한 후. 다른 브로커로 보낸 초당 바이트 수
RequestExemptFromThrottleTime 요청 조절이 적용된 후. 브로커 네트워크 및 I/O 스레드가 조절에서 제외된 요청을 처리하는 데 소비한 평균 시간(밀리초)입니다.
RequestHandlerAvgIdlePercent 클러스터가 ACTIVE 상태에 도달한 후. 요청 핸들러 스레드가 유휴 상태인 시간의 평균 백분율입니다.
RequestThrottleQueueSize 요청 조절이 적용된 후. 조절 대기열에 있는 메시지 수입니다.
RequestThrottleTime 요청 조절이 적용된 후. 평균 요청 조절 시간(밀리초)입니다.
TcpConnections 클러스터가 ACTIVE 상태에 도달한 후.

SYN 플래그가 설정된 수신 및 발신 TCP 세그먼트 수를 표시합니다.

TotalTierBytesLag 주제를 생성한 후. 브로커에서 계층화할 수 있지만 아직 계층형 스토리지로 전송되지 않은 데이터의 총 바이트 수입니다. 이 메트릭은 업스트림 데이터 전송의 효율성을 보여줍니다. 지연 시간이 길어질수록 계층형 스토리지에 유지되지 않는 데이터의 양도 늘어납니다. 카테고리: 아카이브 지연 이것은 KIP-405 메트릭이 아닙니다.
TrafficBytes 클러스터가 ACTIVE 상태에 도달한 후.

클라이언트 (생산자 및 소비자) 와 브로커 간의 네트워크 트래픽을 전체 바이트 단위로 표시합니다. 브로커 간 트래픽은 보고되지 않습니다.

VolumeQueueLength 클러스터가 ACTIVE 상태에 도달한 후.

지정된 기간 동안 완료 대기 중인 읽기 및 쓰기 작업 요청 수입니다.

VolumeReadBytes 클러스터가 ACTIVE 상태에 도달한 후.

지정된 기간의 바이트 수

VolumeReadOps 클러스터가 ACTIVE 상태에 도달한 후.

지정된 기간의 읽기 작업 수입니다.

VolumeTotalReadTime 클러스터가 ACTIVE 상태에 도달한 후.

지정된 기간 동안 완료된 모든 읽기 작업에서 사용한 총 시간 (초) 입니다.

VolumeTotalWriteTime 클러스터가 ACTIVE 상태에 도달한 후.

지정된 기간 동안 완료된 모든 쓰기 작업에서 사용한 총 시간 (초) 입니다.

VolumeWriteBytes 클러스터가 ACTIVE 상태에 도달한 후.

지정된 기간 동안 기록된 바이트 수입니다.

VolumeWriteOps 클러스터가 ACTIVE 상태에 도달한 후.

지정된 기간의 쓰기 작업 수입니다.

PER_TOPIC_PER_BROKER레벨 모니터링

모니터링 수준을 PER_TOPIC_PER_BROKER로 설정하면 모든 PER_BROKER 및 기본 수준 지표 외에 다음 표에 설명된 지표가 표시됩니다. DEFAULT 수준 지표만 무료입니다. 이 표에 있는 지표의 차원은 클러스터 이름, 브로커 ID, 주제입니다.

중요

Apache Kafka 2.4.1 이상 버전을 사용하는 Amazon MSK 클러스터의 경우 다음 표의 지표는 해당 값이 처음으로 0이 아닌 값이 된 후에만 나타납니다. 예를 들어, BytesInPerSec를 보려면 하나 이상의 생산자가 먼저 클러스터로 데이터를 전송해야 합니다.

PER_TOPIC_PER_BROKER 모니터링 수준부터 사용할 수 있는 추가 지표
이름 보이는 경우 설명
FetchMessageConversionsPerSec 주제를 생성한 후. 초당 가져와서 변환한 메시지 수입니다.
MessagesInPerSec 주제를 생성한 후. 초당 수신된 메시지 수입니다.
ProduceMessageConversionsPerSec 주제를 생성한 후. 생산된 메시지의 초당 변환 수입니다.
RemoteBytesInPerSec

주제를 생성하여 주제가 생성/소비되고 있는 경우

지정된 주제 및 브로커에 대한 소비자 가져오기에 대한 응답으로 계층형 스토리지에서 전송된 바이트 수입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.

RemoteBytesOutPerSec 주제를 생성하여 주제가 생성/소비되고 있는 경우

지정된 주제 및 브로커에 대해 계층형 스토리지로 전송된 바이트 수입니다. 이 지표에는 지정된 브로커의 업스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.

RemoteReadErrorPerSec 주제를 생성하면 해당 주제가 생산/소비되고 있는 상태입니다. 지정된 브로커가 지정된 주제에 대한 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 계층화된 스토리지로 보내는 읽기 요청에 대한 응답의 오류 비율입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.
RemoteReadRequestsPerSec 주제를 생성하면 해당 주제가 생산/소비되고 있는 상태입니다. 지정된 브로커가 지정된 주제에 대한 소비자 가져오기에 응답하여 데이터를 검색하기 위해 계층형 스토리지로 보내는 읽기 요청 수입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.
RemoteWriteErrorPerSec 주제를 생성하면 해당 주제가 생산/소비되고 있는 상태입니다. 지정된 브로커가 데이터를 업스트림으로 전송하기 위해 계층화된 스토리지로 보내는 쓰기 요청에 대한 응답의 오류 비율입니다. 이 지표에는 지정된 브로커의 업스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함됩니다. 카테고리: 트래픽 및 오류율 이것은 KIP-405 메트릭입니다.

PER_TOPIC_PER_PARTITION레벨 모니터링

모니터링 수준을 로 설정하면PER_TOPIC_PER_PARTITION, 및 DEFAULT 수준의 모든 지표와 함께 다음 표에 설명된 지표가 표시됩니다.PER_TOPIC_PER_BROKERPER_BROKER DEFAULT 수준 지표만 무료입니다. 이 표의 측정 단위는 소비자 그룹, 주제, 파티션과 같은 차원으로 구성됩니다.

PER_TOPIC_PER_PARTITION 모니터링 수준부터 사용할 수 있는 추가 지표
이름 보이는 경우 설명
EstimatedTimeLag 소비자 그룹이 주제를 소비한 후. 파티션 오프셋 지연을 없애는 데 걸리는 예상 시간 (초) 입니다.
OffsetLag 소비자 그룹이 주제를 소비한 후. 오프셋 수의 파티션 수준 소비자 지연.