Amazon CloudWatch를 사용하여 클러스터 지표 모니터링 - Amazon Elasticsearch Service

문서의 영문과 번역 사이에 충돌이 있는 경우에는 영문 버전을 따릅니다. 번역 버전은 기계 번역을 사용하여 제공합니다.

Amazon CloudWatch를 사용하여 클러스터 지표 모니터링

상태 대시보드 해석

Amazon ES 콘솔의 인스턴스 상태 탭에서는 상자 차트를 사용하여 각 Elasticsearch 노드의 상태를 한 눈에 볼 수 있습니다.

  • 각 색 상자는 지정된 기간 동안 노드의 값 범위를 보여 줍니다.

  • 파란색 상자는 다른 노드와 일관적인 값을 나타냅니다. 빨간색 상자는 이상값을 나타냅니다

  • 각 상자 내의 흰색 선은 노드의 현재 값을 보여 줍니다.

  • 각 상자의 양쪽에 있는 “수염”은 일정 기간 동안 모든 노드의 최소값과 최대값을 보여 줍니다.

Amazon ES 도메인은 1분마다 성능 지표를 Amazon CloudWatch로 전송합니다. 범용 또는 마그네틱 EBS 볼륨을 사용하는 경우에는 EBS 볼륨 지표만 5분마다 업데이트됩니다. 이러한 지표를 보려면 Amazon Elasticsearch Service 콘솔의 Cluster health(클러스터 상태)Instance health(인스턴스 상태) 탭을 사용합니다. 이러한 지표는 추가 요금 없이 제공됩니다.

도메인의 구성을 변경하는 경우 클러스터 상태인스턴스 상태 탭의 개별 인스턴스 목록이 정확한 수로 반환되기 전에 짧은 기간 동안 두 배의 크기로 증가하곤 합니다. 이 동작에 대한 설명은 구성 변경 단원을 참조하십시오.

모든 메트릭은 AWS/ES 네임스페이스. 개별 노드에 대한 메트릭은 ClientId, DomainName, NodeId 치수. 클러스터 메트릭은 Per-Domain, Per-Client Metrics 치수. 일부 노드 메트릭은 클러스터 레벨에서 집계되므로 두 차원 모두에 포함됩니다. 지표는 2주 동안 보관된 후 삭제됩니다.

클러스터 지표

Amazon Elasticsearch Service 클러스터에 대한 다음 메트릭을 제공합니다.

측정치 설명
ClusterStatus.green

값이 1이면 클러스터의 노드에 모든 인덱스 샤드가 할당되었음을 나타냅니다.

관련 통계: 최대

ClusterStatus.yellow 값이 1이면 모든 인덱스의 기본 샤드가 클러스터의 노드에 할당되어 있지만 하나 이상의 인덱스에 대해 복제본 샤드가 할당되어 있지 않음을 나타냅니다. 자세한 정보는 노란색 클러스터 상태 단원을 참조하십시오.

관련 통계: 최대

ClusterStatus.red

값이 1이면 인덱스 하나 이상의 기본 및 복제본 샤드가 클러스터의 노드에 할당되지 않았음을 나타냅니다. 자세한 정보는 빨간색 클러스터 상태 단원을 참조하십시오.

관련 통계: 최대

Nodes

전용 마스터 노드 및 UltraWarm 노드를 포함하여 Amazon ES 클러스터에 포함된 노드 수입니다. 자세한 정보는 구성 변경 단원을 참조하십시오.

관련 통계: 최대

SearchableDocuments

클러스터의 모든 데이터 노드에서 검색 가능한 총 문서 수입니다.

관련 통계: 최소, 최대, 평균

DeletedDocuments

클러스터의 모든 데이터 노드에서 삭제 표시된 총 문서 수입니다. 이들 문서는 더 이상 검색 결과에 나타나지 않지만, Elasticsearch은 세그먼트 병합 시에만 삭제된 문서를 디스크에서 제거합니다. 이 지표는 삭제 요청 후 증가하고 세그먼트 병합 후 감소합니다.

관련 통계: 최소, 최대, 평균

CPUUtilization

클러스터의 데이터 노드에 대한 CPU 사용량 백분율입니다. 최대는 CPU 사용량이 가장 높은 노드를 나타냅니다. 평균은 클러스터의 모든 노드를 나타냅니다. 이 지표는 개별 노드에도 사용할 수 있습니다.

관련 통계: 최대, 평균

FreeStorageSpace

클러스터의 데이터 노드를 위한 사용 가능한 공간. Sum 클러스터에 대한 총 사용 가능한 공간을 보여 주지만, 정확한 값을 얻기 위해 1분 후에 기간을 남겨야 합니다. Minimum and Maximum 은(는) 각각 최소 사용 가능한 공간을 가진 노드를 표시합니다. 이 메트릭은 개별 노드에 대해서도 사용할 수 있습니다. Amazon ES 던지기 ClusterBlockException 이 메트릭이 0. 복구하려면 인덱스를 삭제하거나, 더 큰 인스턴스를 추가하거나, EBS 기반 스토리지를 기존 인스턴스에 추가해야 합니다. 자세히 알아보려면 사용 가능한 스토리지 공간 부족 단원을 참조하십시오.

Amazon ES 콘솔은 이 값을 GiB로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다.

참고

FreeStorageSpace는 Elasticsearch _cluster/stats API가 제공하는 값보다 항상 적습니다. Amazon ES는 내부 작업을 위해 각 인스턴스에 스토리지 공간의 일정 비율을 예약합니다.

관련 통계: 최소, 최대, 평균, 합계

ClusterUsedSpace

클러스터의 총 사용 공간. 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다.

Amazon ES 콘솔은 이 값을 GiB로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다.

관련 통계: 최소, 최대

ClusterIndexWritesBlocked

수신되는 쓰기 요청에 대한 클러스터의 허용 또는 차단 여부를 나타냅니다. 값이 0이면 클러스터가 요청을 허용하고 있다는 것을 의미합니다. 값이 1이면 클러스터가 요청을 차단하고 있다는 것을 의미합니다.

클러스터가 요청을 차단하는 요인은 매우 다양할 수 있습니다. 다음과 같은 일반적인 요인들이 있습니다. FreeStorageSpace 너무 낮음, JVMMemoryPressure 너무 높음, 또는 CPUUtilization 은(는) 너무 높습니다. 이러한 문제를 줄이려면 디스크 공간을 추가하거나 클러스터를 확장하는 것이 좋습니다.

관련 통계: 최대

JVMMemoryPressure

클러스터의 모든 데이터 노드에 사용되는 Java 힙 최대 비율입니다. Amazon ES는 Java 힙에 인스턴스 RAM의 절반을 사용합니다(최대 힙 크기 32GiB). 인스턴스를 최대 64GiB의 RAM까지 수직 확장할 수 있으며 인스턴스를 추가하면 수평 확장도 가능합니다. 권장되는 CloudWatch 경보을(를) 참조하십시오.

관련 통계: 최대

AutomatedSnapshotFailure

클러스터에 대해 실패한 자동 스냅샷 수. 값 1은 지난 36시간 동안 도메인에 대해 생성된 자동 스냅샷이 없음을 나타냅니다.

관련 통계: 최소, 최대

CPUCreditBalance

클러스터의 데이터 노드에 사용할 수 있는 잔여 CPU 크레딧. CPU 크레딧은 1분 동안 CPU 코어의 전체 성능을 제공합니다. 자세한 내용은 CPU 크레딧 in the Amazon EC2 개발자 가이드. 이 지표는 t2.micro.elasticsearch, t2.small.elasticsearcht2.medium.elasticsearch 인스턴스 유형에 대해서만 확인할 수 있습니다.

관련 통계: 최소

KibanaHealthyNodes

Kibana 상태 확인. 값이 1이면 정상적인 동작 상태를 나타냅니다. 값이 0이면 Kibana에 액세스할 수 없다는 것을 나타냅니다. 대부분 경우 Kibana 상태가 클러스터 상태를 그대로 반영합니다.

관련 통계: 최소

KMSKeyError

값 1은 저장 데이터를 암호화하는 데 사용된 KMS 고객 마스터 키가 비활성화된 것을 나타냅니다. 도메인을 정상 작동으로 복원하려면 키를 다시 활성화해야 합니다. 콘솔에는 저장 데이터를 암호화하는 도메인에 대해서만 이 지표가 표시됩니다.

관련 통계: 최소, 최대

KMSKeyInaccessible

값 1은 유휴 데이터를 암호화하는 데 사용된 KMS 고객 마스터 키가 삭제되었거나 Amazon ES에 대한 권한 부여가 취소되었음을 나타냅니다. 이 상태의 도메인은 복원할 수 없습니다. 하지만 수동 스냅샷이 있는 경우 해당 스냅샷을 사용하여 도메인의 데이터를 새 도메인으로 마이그레이션할 수 있습니다. 콘솔에는 저장 데이터를 암호화하는 도메인에 대해서만 이 지표가 표시됩니다.

관련 통계: 최소, 최대

InvalidHostHeaderRequests

잘못된(또는 누락된) 호스트 헤더를 포함하여 Elasticsearch 클러스터에 수행된 HTTP 요청 수입니다. 유효 요청은 호스트 헤더 값으로 도메인 호스트 이름을 포함합니다. Amazon ES는 제한적인 액세스 정책이 없는 퍼블릭 액세스 도메인에 대한 잘못된 요청을 거부합니다. 모든 도메인에 제한적인 액세스 정책을 적용하는 것을 권장합니다.

이 지표에 대한 값이 클 경우, 사용자의 Elasticsearch 클라이언트가 요청에 도메인 호스트 이름이(예를 들어, IP 주소 아님) 포함되었는지 확인합니다.

관련 통계: 합계

ElasticsearchRequests

Elasticsearch 클러스터에 수행된 요청 수입니다.

관련 통계: 합계

2xx, 3xx, 4xx, 5xx

해당 HTTP 응답 코드(2xx, 3xx, 4xx, 5xx)를 발생시킨 도메인에 대한 요청 건수입니다.

관련 통계: 합계

전용 마스터 노드 지표

Amazon Elasticsearch Service 다음 메트릭을 제공합니다. 전용 마스터 노드.

측정치 설명
MasterCPUUtilization

전용 마스터 노드에서 사용하는 최대 CPU 리소스 비율. 이 지표가 60%에 도달하면 인스턴스 유형의 크기를 늘리는 것이 좋습니다.

관련 통계: Average

MasterFreeStorageSpace

이 지표는 관련이 없으므로 무시해도 좋습니다. 이 서비스에서는 마스터 노드를 데이터 노드로 사용하지 않습니다.

MasterJVMMemoryPressure

클러스터의 모든 전용 마스터 노드에 사용되는 Java 힙의 최대 비율. 이 지표가 85%에 도달하면 더 큰 인스턴스 유형으로 이전하는 것이 좋습니다.

관련 통계: 최대

MasterCPUCreditBalance

클러스터의 전용 마스터 노드에 사용할 수 있는 잔여 CPU 크레딧. CPU 크레딧은 1분 동안 CPU 코어의 전체 성능을 제공합니다. 자세한 내용은 CPU 크레딧 in the Linux 인스턴스용 Amazon EC2 사용 설명서. 이 지표는 t2.micro.elasticsearch, t2.small.elasticsearcht2.medium.elasticsearch 인스턴스 유형에 대해서만 확인할 수 있습니다.

관련 통계: 최소

MasterReachableFromNode

MasterNotDiscovered 예외 상태. 값이 1이면 정상적인 동작 상태를 나타냅니다. 값이 0이면 /_cluster/health/가 오류를 일으킨 것을 나타냅니다.

여기에서 오류란 마스터 노드가 중단되었거나, 도달할 수 없다는 것을 의미합니다. 이러한 오류가 발생하는 이유는 대부분 네트워크 연결 문제 또는 AWS 종속성 문제에서 기인합니다.

관련 통계: 최소

MasterSysMemoryUtilization

사용 중인 마스터 노드 메모리의 비율입니다.

관련 통계: 최대

EBS 볼륨 지표

Amazon Elasticsearch Service 에서는 EBS 볼륨에 대해 다음 메트릭을 제공합니다.

측정치 설명
ReadLatency

EBS 볼륨에 대한 읽기 작업의 지연 시간(초)

관련 통계: 최소, 최대, 평균

WriteLatency

EBS 볼륨에 대한 쓰기 작업의 지연 시간(초)

관련 통계: 최소, 최대, 평균

ReadThroughput

EBS 볼륨에 대한 읽기 작업의 처리량(바이트/초)

관련 통계: 최소, 최대, 평균

WriteThroughput

EBS 볼륨에 대한 쓰기 작업의 처리량(바이트/초)

관련 통계: 최소, 최대, 평균

DiskQueueDepth

EBS 볼륨에 대해 대기 중인 I/O 요청 수

관련 통계: 최소, 최대, 평균

ReadIOPS

EBS 볼륨에 대한 읽기 작업의 초당 I/O 작업 수

관련 통계: 최소, 최대, 평균

WriteIOPS

EBS 볼륨에 대한 쓰기 작업의 초당 I/O 작업 수

관련 통계: 최소, 최대, 평균

인스턴스 지표

Amazon Elasticsearch Service 도메인의 각 인스턴스에 대해 다음 메트릭을 제공합니다. Amazon ES 또한 이 인스턴스 메트릭을 집계하여 전체 클러스터 건전성에 대한 통찰력을 제공합니다. 콘솔의 데이터 샘플 통계를 이용하여 이 동작을 확인할 수 있습니다. 다음 표의 각 지표는 노드 클러스터 관련 통계를 포함합니다.

중요

다른 버전 Elasticsearch 다른 스레드를 사용하여 통화를 처리하려면 _index API Elasticsearch 1.5 및 2.3은 인덱스 스레드 풀을 사용합니다. Elasticsearch 5.x, 6.0 및 6.2는 벌크 스레드 풀을 사용합니다. 6.3 이상 쓰기 스레드 풀을 사용합니다. 현재 Amazon ES 콘솔에는 벌크 스레드 풀에 대한 그래프가 포함되어 있지 않습니다.

측정치 설명
IndexingLatency

샤드 1개가 인덱싱 작업을 완료하는 데 걸리는 평균 시간(밀리초)입니다.

관련 노드 통계: Average

관련 클러스터 통계: 평균, 최대

IndexingRate

분당 인덱싱 작업 수입니다. 2개의 문서를 추가하고 2개를 4개 작업으로 업데이트하는 _bulk API에 대한 하나의 호출입니다. 이것은 하나 이상의 노드에 분산될 수 있습니다. 인덱스에 하나 이상의 복제본이 있는 경우 클러스터의 다른 노드 역시 총 4개의 인덱싱 작업을 기록합니다. 문서 삭제는 이 지표에 포함되지 않습니다.

관련 노드 통계: Average

관련 클러스터 통계: 평균, 최대, 합계

SearchLatency

데이터 노드에서 샤드 1개가 검색 작업을 완료하는 데 걸리는 평균 시간(밀리초)입니다.

관련 노드 통계: Average

관련 클러스터 통계: 평균, 최대

SearchRate

한 데이터 노드의 모든 샤드에 대한 분당 검색 요청의 총 수입니다. _search API에 대한 단일 호출은 많은 샤드로부터 결과를 반환할 수 있습니다. 이러한 샤드 중 5개가 한 노드에 있는 경우, 클라이언트가 단 한 개만 요청했더라도 노드는 이 지표에 대해 5를 보고할 것입니다.

관련 노드 통계: Average

관련 클러스터 통계: 평균, 최대, 합계

SysMemoryUtilization

사용 중인 인스턴스 메모리의 비율(%)입니다. 이 지표의 값이 높은 것은 정상이며 일반적으로 클러스터에 문제가 있음을 나타내지 않습니다. 잠재적인 성능 및 안정성 문제에 대한 더 나은 지표는 JVMMemoryPressure 지표를 참조하십시오.

관련 노드 통계: 최소, 최대, 평균

관련 클러스터 통계: 최소, 최대, 평균

JVMGCYoungCollectionCount

"신세대" 가비지 수집이 실행된 횟수입니다. 클러스터 작업은 일반적으로 실행 수가 계속 증가하여 커집니다.

관련 노드 통계: 최대

관련 클러스터 통계: 합계, 최대, 평균

JVMGCYoungCollectionTime

클러스터가 "신세대"가비지 수집을 수행하는 데 소비 한 시간(밀리 초)입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 합계, 최대, 평균

JVMGCOldCollectionCount

"구세대"가비지 수집이 실행된 횟수입니다. 리소스가 충분한 클러스터에서는 이 수가 작게 유지되고 자주 증가하지 않습니다.

관련 노드 통계: 최대

관련 클러스터 통계: 합계, 최대, 평균

JVMGCOldCollectionTime

클러스터가 "구세대"가비지 수집을 수행하는 데 소비 한 시간 (밀리 초)입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 합계, 최대, 평균

ThreadpoolForce_mergeQueue

강제 병합 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속적으로 높으면 클러스터 확장을 고려하십시오.

관련 노드 통계: 최대

관련 클러스터 통계: 합계, 최대, 평균

ThreadpoolForce_mergeRejected

강제 병합 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려하십시오.

관련 노드 통계: 최대

관련 클러스터 통계: 합계

ThreadpoolForce_mergeThreads

강제 병합 스레드 풀의 크기입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 평균, 합계

ThreadpoolIndexQueue

인덱스 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속적으로 높으면 클러스터 확장을 고려하십시오. 인덱스 대기열의 최대 크기는 200입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 합계, 최대, 평균

ThreadpoolIndexRejected

인덱스 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려하십시오.

관련 노드 통계: 최대

관련 클러스터 통계: 합계

ThreadpoolIndexThreads

인덱스 스레드 풀의 크기입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 평균, 합계

ThreadpoolSearchQueue

검색 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속적으로 높으면 클러스터 확장을 고려하십시오. 검색 대기열의 최대 크기는 1,000입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 합계, 최대, 평균

ThreadpoolSearchRejected

검색 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려하십시오.

관련 노드 통계: 최대

관련 클러스터 통계: 합계

ThreadpoolSearchThreads

검색 스레드 풀의 크기입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 평균, 합계

ThreadpoolBulkQueue

벌크 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속적으로 높으면 클러스터 확장을 고려하십시오.

관련 노드 통계: 최대

관련 클러스터 통계: 합계, 최대, 평균

ThreadpoolBulkRejected

벌크 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려하십시오.

관련 노드 통계: 최대

관련 클러스터 통계: 합계

ThreadpoolBulkThreads

벌크 스레드 풀의 크기입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 평균, 합계

ThreadpoolWriteThreads

쓰기 스레드 풀의 크기입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 평균, 합계

ThreadpoolWriteRejected

쓰기 스레드 풀에서 거부된 작업의 수입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 평균, 합계

ThreadpoolWriteQueue

쓰기 스레드 풀에서 대기 중인 작업의 수입니다.

관련 노드 통계: 최대

관련 클러스터 통계: 평균, 합계

UltraWarm 지표

Amazon Elasticsearch Service 다음 메트릭을 제공합니다. 울트라팔 노드.

측정치 설명
WarmCPUUtilization

클러스터의 UltraWarm 노드에 대한 CPU 사용량 백분율입니다. 최대는 CPU 사용량이 가장 높은 노드를 나타냅니다. 평균은 클러스터의 모든 UltraWarm 노드를 나타냅니다. 이 지표는 개별 UltraWarm 노드에도 사용할 수 있습니다.

관련 통계: 최대, 평균

WarmFreeStorageSpace

사용 가능한 웜 스토리지 공간(MiB)입니다. UltraWarm은 연결된 디스크 대신 Amazon S3을 사용하기 때문에 Sum이 유일한 관련 통계입니다. 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다.

관련 통계: 합계

WarmJVMMemoryPressure

UltraWarm 노드에 사용되는 Java 힙의 최대 비율입니다.

관련 통계: 최대

WarmSearchableDocuments

클러스터의 모든 웜 인덱스에서 검색 가능한 총 문서 수입니다. 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다.

관련 통계: 합계

WarmSearchLatency

UltraWarm 노드에서 샤드 1개가 검색 작업을 완료하는 데 걸리는 평균 시간(밀리초)입니다.

관련 노드 통계: Average

관련 클러스터 통계: 평균, 최대

WarmSearchRate

한 UltraWarm 노드의 모든 샤드에 대한 분당 검색 요청의 총 수입니다. _search API에 대한 단일 호출은 많은 샤드로부터 결과를 반환할 수 있습니다. 이러한 샤드 중 5개가 한 노드에 있는 경우, 클라이언트가 단 한 개만 요청했더라도 노드는 이 지표에 대해 5를 보고할 것입니다.

관련 노드 통계: Average

관련 클러스터 통계: 평균, 최대, 합계

WarmStorageSpaceUtilization

클러스터가 사용 중인 총 웜 스토리지 공간 크기입니다. Amazon ES 콘솔은 이 값을 GiB로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다.

관련 통계: 최대

HotStorageSpaceUtilization

클러스터를 사용 중인 총 핫 스토리지 공간 크기입니다. Amazon ES 콘솔은 이 값을 GiB로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다.

관련 통계: 최대

WarmSysMemoryUtilization

사용 중인 웜 노드 메모리의 비율입니다.

관련 통계: 최대

HotToWarmMigrationQueueSize

현재 핫 스토리지에서 웜 스토리지로 마이그레이션되는 인덱스 수입니다.

관련 통계: 최대

WarmToHotMigrationQueueSize

현재 웜 스토리지에서 핫 스토리지로 마이그레이션되는 인덱스 수입니다.

관련 통계: 최대

알림 지표

Amazon Elasticsearch Service 에 대해 다음 메트릭을 제공합니다. 알림 기능.

측정치 설명
AlertingDegraded

값이 1이면 알림 인덱스가 빨간색이거나 하나 이상의 노드가 일정에 따라 실행되지 않음을 의미하고, 값이 0이면 정상적인 동작 상태를 나타냅니다.

관련 통계: 최대

AlertingIndexExists

값이 1이면 .opendistro-alerting-config 인덱스가 존재함을 의미하고, 값이 0이면 존재하지 않음을 의미합니다. 알림 기능을 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: 최대

AlertingIndexStatus.green

인덱스의 상태입니다. 값이 1이면 녹색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 녹색이 아님을 의미합니다.

관련 통계: 최대

AlertingIndexStatus.red

인덱스의 상태입니다. 값이 1이면 빨간색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 빨간색이 아님을 의미합니다.

관련 통계: 최대

AlertingIndexStatus.yellow

인덱스의 상태입니다. 값이 1이면 노란색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 노란색이 아님을 의미합니다.

관련 통계: 최대

AlertingNodesNotOnSchedule

값이 1이면 일부 작업이 일정에 따라 실행되고 있지 않음을 의미하고, 값이 0이면 모든 알림 작업이 일정에 따라 실행 중이거나 알림 작업이 없음을 의미합니다. Amazon ES 콘솔을 점검하거나 _nodes/stats 요청을 실행하여 리소스 사용량이 높은 노드가 있는지 확인하십시오.

관련 통계: 최대

AlertingNodesOnSchedule

값이 1이면 모든 알림 작업이 일정에 따라 실행 중이거나 알림 작업이 없음을 의미하고, 값이 0이면 일부 작업이 일정에 따라 실행되고 있지 않음을 의미합니다.

관련 통계: 최대

AlertingScheduledJobEnabled

값이 1이면 opendistro.scheduled_jobs.enabled 클러스터 설정이 true임을 의미하고, 값이 0이면 false이며 예약된 작업이 비활성화되었음을 의미합니다.

관련 통계: 최대

이상 탐지 지표

Amazon Elasticsearch Service 에 대해 다음 메트릭을 제공합니다. 이상 탐지 기능.

측정치 설명
AnomalyDetectionPluginUnhealthy

값이 1이면 실패 횟수가 많거나 사용하는 인덱스 중 하나가 빨간색이기 때문에 이상 탐지 플러그인이 제대로 작동하지 않음을 의미합니다. 값이 0이면 플러그인이 예상대로 작동하고 있음을 나타냅니다.

관련 통계: 최대

AnomalyDetectionRequestCount

이상을 탐지하기 위한 요청 수입니다.

관련 통계: 합계

AnomalyDetectionFailureCount

이상을 탐지하기 위한 실패한 요청 수입니다.

관련 통계: 합계

AnomalyResultsIndexStatusIndexExists

값이 1이면 .opendistro-anomaly-results 별칭이 가리키는 인덱스가 존재함을 의미합니다. 이상 탐지 기능을 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: 최대

AnomalyResultsIndexStatus.red

값이 1이면 .opendistro-anomaly-results 별칭이 가리키는 인덱스가 빨간색임을 의미합니다. 값이 0이면 그렇지 않음을 의미합니다. 이상 탐지 기능을 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: 최대

AnomalyDetectorsIndexStatusIndexExists

값이 1이면 .opendistro-anomaly-detectors 인덱스가 존재함을 의미하고, 값이 0이면 존재하지 않음을 의미합니다. 이상 탐지 기능을 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: 최대

AnomalyDetectorsIndexStatus.red

값이 1이면 .opendistro-anomaly-detectors 인덱스가 빨간색임을 의미합니다. 값이 0이면 그렇지 않음을 의미합니다. 이상 탐지 기능을 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: 최대

ModelsCheckpointIndexStatusIndexExists

값이 1이면 .opendistro-anomaly-checkpoints 인덱스가 존재함을 의미하고, 값이 0이면 존재하지 않음을 의미합니다. 이상 탐지 기능을 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: 최대

ModelsCheckpointIndexStatus.red

값이 1이면 .opendistro-anomaly-checkpoints 인덱스가 빨간색임을 의미합니다. 값이 0이면 그렇지 않음을 의미합니다. 이상 탐지 기능을 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: 최대

SQL 지표

Amazon Elasticsearch Service 다음 메트릭을 제공합니다. SQL 지원.

측정치 설명
SQLFailedRequestCountByCusErr

클라이언트 문제로 인해 실패한, _opendistro/_sql API에 대한 요청 수입니다. 예를 들어 IndexNotFoundException로 인해 요청이 HTTP 상태 코드 400을 반환할 수 있습니다.

관련 통계: 합계

SQLFailedRequestCountBySysErr

서버 문제 또는 기능 제한으로 인해 실패한, _opendistro/_sql API에 대한 요청 수입니다. 예를 들어 VerificationException로 인해 요청이 HTTP 상태 코드 503을 반환할 수 있습니다.

관련 통계: 합계

SQLRequestCount

_opendistro/_sql API 요청 수입니다.

관련 통계: 합계

SQLDefaultCursorRequestCount

SQLRequestCount와 유사하지만 페이지 매김 요청만 계산합니다.

관련 통계: 합계

SQLUnhealthy

값이 1이면 특정 요청에 대한 응답으로 SQL 플러그인이 5xx 응답 코드를 반환하거나 잘못된 쿼리 DSL을 Elasticsearch에 전달함을 나타냅니다. 다른 요청은 계속 성공합니다. 값이 0이면 최근 실패가 없음을 나타냅니다. 지속적으로 값이 1이면 클라이언트가 플러그인에 수행하는 요청 문제를 해결하십시오.

관련 통계: 최대

KNN 지표

Amazon Elasticsearch Service 에 대한 메트릭 포함 니니. 각각에 대한 요약은 Open Distro for Elasticsearch 설명서를 참조하십시오.

Amazon Elasticsearch Service 다음 메트릭을 제공합니다. 크로스 클러스터 검색.

소스 도메인 지표

측정치 차원: 설명
CrossClusterOutboundConnections

ConnectionId

연결된 노드 수입니다. 응답에 하나 이상의 건너뛴 도메인이 포함된 경우 이 지표를 사용하여 비정상 연결을 추적하십시오. 이 숫자가 0으로 떨어지면 연결이 비정상입니다.

CrossClusterOutboundRequests

ConnectionId

대상 도메인으로 전송된 검색 요청 수입니다. 클러스터 간 검색 요청의 부하가 도메인에 너무 부담이 되는지 확인하고 이 지표의 스파이크와 JVM/CPU 스파이크의 상관 관계를 분석하는 데 사용합니다.

대상 도메인 지표

측정치 차원: 설명
CrossClusterInboundRequests

ConnectionId

소스 도메인에서 받은 수신 연결 요청 수입니다.

예기치 않게 연결이 끊어지는 경우 CloudWatch 경보를 추가합니다. 경보를 생성하는 단계는 정적 임계값을 기반으로 CloudWatch 경보 생성을 참조하십시오.

메트릭 순위 평가

Amazon Elasticsearch Service 다음 메트릭을 제공합니다. 랭킹 학습.

측정치 설명
LTRRequestTotalCount

총 순위 요청 수.

LTRRequestErrorCount

실패한 요청 총 수.

LTRStoreIndexIsRed

플러그인을 실행하는 데 필요한 인덱스 중 하나가 빨간색인지 추적합니다.

LTRMemoryUsage

플러그인이 사용하는 총 메모리 입니다.