MSK Connect 모니터링 - Amazon Managed Streaming for Apache Kafka

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

MSK Connect 모니터링

모니터링은 MSK Connect 및 기타 AWS 솔루션의 신뢰성, 가용성 및 성능을 유지하는 데 있어 중요한 부분입니다. Amazon은 실행 중인 AWS 리소스와 애플리케이션을 AWS 실시간으로 CloudWatch 모니터링합니다. 지표를 수집 및 추적하고, 맞춤 대시보드를 생성할 수 있으며, 지정된 지표가 지정한 임계값에 도달하면 사용자에게 알리거나 조치를 취하도록 경보를 설정할 수 있습니다. 예를 들어 커넥터의 CPU 사용량 또는 기타 지표를 CloudWatch 추적하여 필요한 경우 용량을 늘릴 수 있습니다. 자세한 내용은 Amazon CloudWatch 사용 설명서를 참조하십시오.

다음 표에는 MSK Connect가 ConnectorName 차원 CloudWatch 아래에 보내는 메트릭이 나와 있습니다. MSK Connect는 기본적으로 추가 비용 없이 이러한 메트릭을 제공합니다. CloudWatch 이러한 지표를 15개월 동안 보관하므로 과거 정보에 액세스하고 커넥터의 성능을 더 잘 파악할 수 있습니다. 특정 임계값을 주시하다가 해당 임계값이 충족될 때 알림을 전송하거나 조치를 취하도록 경보를 설정할 수도 있습니다. 자세한 내용은 Amazon CloudWatch 사용 설명서를 참조하십시오.

MSK Connect 지표
지표 이름 설명
BytesInPerSec 커넥터가 수신한 총 바이트 수입니다.
BytesOutPerSec 커넥터가 전송한 총 바이트 수입니다.
CpuUtilization 시스템 및 사용자별 CPU 사용량 비율입니다.
ErroredTaskCount 오류가 발생한 작업의 수입니다.
MemoryUtilization 현재 사용 중인 Java 가상 머신(JVM) 힙 메모리뿐만 아니라 작업자 인스턴스의 전체 메모리에서 차지하는 비율입니다. JVM은 일반적으로 운영 체제로 메모리를 다시 릴리스하지 않습니다. 따라서 JVM 힙 크기 (MemoryUtilization) 는 일반적으로 최소 힙 크기로 시작하여 안정적인 최대값인 약 80-90% 까지 점진적으로 증가합니다. 커넥터의 실제 메모리 사용량이 변경됨에 따라 JVM 힙 사용량이 증가하거나 감소할 수 있습니다.
RebalanceCompletedTotal 해당 커넥터가 완료한 총 재조정 횟수입니다.
RebalanceTimeAvg 커넥터가 재조정에 소요한 평균 시간(밀리초)입니다.
RebalanceTimeMax 커넥터가 재조정에 소요한 최대 시간(밀리초)입니다.
RebalanceTimeSinceLast

해당 커넥터가 가장 최근에 재조정을 완료한 후의 시간(밀리초)입니다.

RunningTaskCount 커넥터에서 실행 중인 작업 수입니다.
SinkRecordReadRate Apache Kafka나 Amazon MSK 클러스터에서 읽은 초당 평균 레코드 수입니다.
SinkRecordSendRate 변환에서 출력되어 대상으로 전송되는 초당 평균 레코드 수입니다. 이 숫자에는 필터링된 레코드가 포함되지 않습니다.
SourceRecordPollRate 생성되거나 폴링된 초당 평균 레코드 수입니다.
SourceRecordWriteRate 변환에서 출력되어 Apache Kafka 또는 Amazon MSK 클러스터에 기록되는 초당 평균 레코드 수입니다.
TaskStartupAttemptsTotal 커넥터가 시도한 총 작업 시작 횟수입니다. 이 지표를 사용하여 작업 시작 시도의 이상 징후를 식별할 수 있습니다.
TaskStartupSuccessPercentage 커넥터에 대한 성공적인 태스크 시작의 평균 비율입니다. 이 지표를 사용하여 작업 시작 시도의 이상 징후를 식별할 수 있습니다.
WorkerCount 커넥터에서 실행 중인 작업자 수입니다.