Amazon을 통한 OpenSearch 클러스터 지표 모니터링 CloudWatch - 아마존 OpenSearch 서비스

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon을 통한 OpenSearch 클러스터 지표 모니터링 CloudWatch

Amazon OpenSearch 서비스는 도메인의 데이터를 CloudWatch Amazon에 게시합니다. CloudWatch 이러한 데이터 포인트에 대한 통계를 지표라고 하는 정렬된 시계열 데이터 세트로 검색할 수 있습니다. OpenSearch 서비스는 대부분의 메트릭을 60초 CloudWatch 간격으로 전송합니다. 범용 또는 마그네틱 EBS 볼륨을 사용하는 경우 EBS 볼륨 지표는 5분마다 업데이트됩니다. 모든 누적 지표 (예: ThreadpoolWriteRejectedThreadpoolSearchRejected) 는 메모리에 있으며 상태가 손실됩니다. 지표는 노드 삭제, 노드 바운스, 노드 교체 및 블루/그린 배포 중에 재설정됩니다. CloudWatchAmazon에 대한 자세한 내용은 Amazon CloudWatch 사용 설명서를 참조하십시오.

OpenSearch 서비스 콘솔에는 의 원시 데이터를 기반으로 한 일련의 차트가 표시됩니다 CloudWatch. 필요에 따라 콘솔에서 그래프 CloudWatch 대신 클러스터 데이터를 보는 것을 선호할 수도 있습니다. 지표는 2주 동안 보관된 후 삭제됩니다. 지표는 추가 비용 없이 제공되지만 대시보드 및 경보 생성 비용은 CloudWatch 여전히 부과됩니다. 자세한 내용은 Amazon CloudWatch 요금을 참조하십시오.

OpenSearch 서비스는 다음과 같은 지표를 게시합니다. CloudWatch

에서 지표 보기 CloudWatch

CloudWatch 지표는 먼저 서비스 네임스페이스별로 그룹화된 다음 각 네임스페이스 내의 다양한 차원 조합별로 그룹화됩니다.

콘솔을 사용하여 메트릭을 보려면 CloudWatch
  1. 에서 CloudWatch 콘솔을 엽니다 https://console.aws.amazon.com/cloudwatch/.

  2. 왼쪽 탐색 창에서 Metrics(지표)를 찾은 다음 All metrics(모든 지표)를 선택합니다. ES/ OpenSearchService 네임스페이스를 선택합니다.

  3. 해당 지표를 보려면 차원을 선택합니다. 개별 노드에 대한 지표는 ClientId, DomainName, NodeId 차원에 있습니다. 클러스터 지표는 Per-Domain, Per-Client Metrics 차원에 있습니다. 일부 노드 지표는 클러스터 수준에서 집계되므로 두 차원 모두에 포함됩니다. 샤드 지표는 ClientId, DomainName, NodeId, ShardRole 차원에 있습니다.

를 사용하여 메트릭 목록을 보려면 AWS CLI

다음 명령 실행:

aws cloudwatch list-metrics --namespace "AWS/ES"

서비스의 상태 차트 해석 OpenSearch

OpenSearch 서비스에서 지표를 보려면 클러스터 상태 및 인스턴스 상태 탭을 사용하십시오. Instance Health 탭에서는 상자 차트를 사용하여 각 OpenSearch 노드의 상태를 at-a-glance 파악할 수 있습니다.

Chart showing search rate and CPU utilization for different instances with varying percentages.
  • 각 색 상자는 지정된 기간에 노드의 값 범위를 보여줍니다.

  • 파란색 상자는 다른 노드와 일관적인 값을 나타냅니다. 빨간색 상자는 이상값을 나타냅니다

  • 각 상자 내의 흰색 선은 노드의 현재 값을 보여줍니다.

  • 각 상자의 양쪽에 있는 “수염”은 일정 기간에 모든 노드의 최솟값과 최댓값을 보여줍니다.

도메인의 구성을 변경하는 경우 Cluster health(클러스터 상태) 및 Instance health(인스턴스 상태) 탭의 개별 인스턴스 목록이 정확한 수로 반환되기 전에 짧은 기간에 두 배의 크기로 증가하곤 합니다. 이 동작에 대한 설명은 Amazon OpenSearch 서비스에서 구성 변경 섹션을 참조하세요.

클러스터 지표

Amazon OpenSearch Service는 클러스터에 대해 다음과 같은 지표를 제공합니다.

지표 설명
ClusterStatus.green

값이 1이면 클러스터의 노드에 모든 인덱스 샤드가 할당되었음을 나타냅니다.

관련 통계: Maximum

ClusterStatus.yellow 값이 1이면 모든 인덱스의 기본 샤드가 클러스터의 노드에 할당되어 있지만 하나 이상의 인덱스에 대해 복제본 샤드가 할당되어 있지 않음을 나타냅니다. 자세한 내용은 노란색 클러스터 상태 단원을 참조하십시오.

관련 통계: Maximum

ClusterStatus.red

값이 1이면 인덱스 하나 이상의 기본 및 복제본 샤드가 클러스터의 노드에 할당되지 않았음을 나타냅니다. 자세한 내용은 빨간색 클러스터 상태 섹션을 참조하세요.

관련 통계: Maximum

Shards.active

활성 기본 및 복제본 샤드의 총 수입니다.

관련 통계: Maximum, Sum

Shards.unassigned

클러스터의 노드에 할당되지 않은 샤드 수입니다.

관련 통계: Maximum, Sum

Shards.delayedUnassigned

제한 시간 설정으로 노드 할당이 지연된 샤드 수입니다.

관련 통계: Maximum, Sum

Shards.activePrimary

활성 기본 샤드 수입니다.

관련 통계: Maximum, Sum

Shards.initializing

초기화 중인 샤드 수입니다.

관련 통계: 합계

Shards.relocating

재배치 중인 샤드 수입니다.

관련 통계: 합계

Nodes

전용 마스터 노드 및 노드를 포함한 OpenSearch 서비스 클러스터의 UltraWarm 노드 수 자세한 내용은 Amazon OpenSearch 서비스에서 구성 변경 단원을 참조하십시오.

관련 통계: Maximum

SearchableDocuments

클러스터의 모든 데이터 노드에서 검색 가능한 총 문서 수입니다.

관련 통계: 최소, 최대, 평균

DeletedDocuments

클러스터의 모든 데이터 노드에서 삭제 표시된 총 문서 수입니다. 이러한 문서는 더 이상 검색 결과에 표시되지 않고 세그먼트 병합 중에 디스크에서 삭제된 OpenSearch 문서만 제거합니다. 이 지표는 삭제 요청 후 증가하고 세그먼트 병합 후 감소합니다.

관련 통계: 최소, 최대, 평균

CPUUtilization

클러스터의 데이터 노드 CPU 사용률. 최대값은 CPU 사용량이 가장 많은 노드를 나타냅니다. 평균은 클러스터의 모든 노드를 나타냅니다. 이 지표는 개별 노드에도 사용할 수 있습니다.

관련 통계: Maximum, Average

FreeStorageSpace

클러스터에서 사용할 수 있는 데이터 노드 공간입니다. Sum은 클러스터의 사용 가능한 전체 공간을 표시하지만, 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다. Minimum, Maximum은 사용 가능한 공간이 가장 작은 노드와 가장 큰 노드를 각각 표시합니다. 이 지표는 개별 노드에서도 사용할 수 있습니다. OpenSearch 이 지표에 ClusterBlockException 0 도달하면 서비스에서 a가 발생합니다. 복구하려면 인덱스를 삭제하거나, 더 큰 인스턴스를 추가하거나, 기존 인스턴스에 EBS 기반 스토리지를 추가해야 합니다. 자세한 내용은 사용 가능한 스토리지 공간 부족을 참조하십시오.

OpenSearch 서비스 콘솔은 이 값을 GiB 단위로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다.

참고

FreeStorageSpace항상 OpenSearch _cluster/stats 및 에서 _cat/allocation APIs 제공하는 값보다 낮습니다. OpenSearch 서비스는 각 인스턴스의 스토리지 공간 중 일정 비율을 내부 작업을 위해 예약합니다. 자세한 내용은 스토리지 요구 사항 계산을 참조하세요.

관련 통계: Minimum, Maximum, Average, Sum

ClusterUsedSpace

클러스터의 총 사용 공간입니다. 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다.

OpenSearch 서비스 콘솔은 이 값을 GiB 단위로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다.

관련 통계: Minimum, Maximum

ClusterIndexWritesBlocked

수신되는 쓰기 요청에 대한 클러스터의 허용 또는 차단 여부를 나타냅니다. 값이 0이면 클러스터가 요청을 허용하고 있다는 것을 의미합니다. 값이 1이면 클러스터가 요청을 차단하고 있다는 것을 의미합니다.

몇 가지 공통적인 요인을 꼽자면 FreeStorageSpace가 너무 낮은 경우 또는 JVMMemoryPressure가 너무 높은 경우가 있습니다. 이러한 문제를 줄이려면 디스크 공간을 추가하거나 클러스터를 확장하는 것이 좋습니다.

관련 통계: Maximum

JVMMemoryPressure

클러스터의 모든 데이터 노드에 사용된 Java 힙의 최대 비율입니다. OpenSearch 서비스는 인스턴스의 절반을 Java RAM 힙에 사용하며, 힙 크기는 최대 32GiB입니다. 인스턴스를 수직으로 최대 RAM 64GiB까지 확장할 수 있으며, 이때 인스턴스를 추가하여 수평으로 확장할 수 있습니다. 아마존 OpenSearch 서비스를 위한 권장 CloudWatch 알람을 참조하세요.

관련 통계: Maximum

참고

서비스 소프트웨어 R20220323에서 이 지표에 대한 로직이 변경되었습니다. 자세한 내용은 릴리스 정보를 참조하세요.

OldGenJVMMemoryPressure

클러스터의 모든 데이터 노드에서 '구세대'에 사용된 Java 힙의 최대 비율입니다. 이 지표는 노드 수준에도 사용할 수 있습니다.

관련 통계: Maximum

AutomatedSnapshotFailure

클러스터에 대해 실패한 자동 스냅샷 수입니다. 값 1은 지난 36시간 동안 도메인에 대해 생성된 자동 스냅샷이 없음을 나타냅니다.

관련 통계: Minimum, Maximum

CPUCreditBalance

클러스터의 데이터 노드에 사용할 수 있는 나머지 CPU 크레딧입니다. CPU크레딧은 1분 동안 풀 CPU 코어의 성능을 제공합니다. 자세한 내용은 Amazon EC2 개발자 안내서의 CPU 크레딧을 참조하십시오. 이 지표는 T2 인스턴스 유형에 대해서만 확인할 수 있습니다.

관련 통계: Minimum

OpenSearchDashboardsHealthyNodes

OpenSearch 대시보드 상태 점검. 최솟값, 최댓값 및 평균이 모두 1과 같으면 Dashboards가 정상적으로 동작하고 있습니다. 최대 1, 최소 0, 평균 0.7인 노드가 10개 있는 경우 이는 노드 7개(70%)가 정상이고 노드 3개(30%)가 비정상임을 의미합니다.

관련 통계: 최소, 최대, 평균

OpensearchDashboardsReportingFailedRequestSysErrCount

서버 문제 또는 기능 제한으로 인해 실패한 OpenSearch 대시보드 보고서 생성 요청 수입니다.

관련 통계: 합계

OpensearchDashboardsReportingFailedRequestUserErrCount

클라이언트 문제로 인해 실패한 OpenSearch 대시보드 보고서 생성 요청 수

관련 통계: 합계

OpensearchDashboardsReportingRequestCount

OpenSearch 대시보드 보고서를 생성하기 위한 총 요청 수입니다.

관련 통계: 합계

OpensearchDashboardsReportingSuccessCount

OpenSearch 대시보드 보고서 생성을 성공적으로 요청한 횟수.

관련 통계: 합계

KMSKeyError

값이 1이면 다음을 나타냅니다. AWS KMS 저장된 데이터를 암호화하는 데 사용되는 키가 비활성화되었습니다. 도메인을 정상 작동으로 복원하려면 키를 다시 활성화해야 합니다. 콘솔에는 저장된 데이터를 암호화하는 도메인에 대해서만 이 지표가 표시됩니다.

관련 통계: Minimum, Maximum

KMSKeyInaccessible

값이 1이면 다음을 나타냅니다. AWS KMS 저장된 데이터를 암호화하는 데 사용된 키가 삭제되었거나 서비스에 대한 부여가 취소되었습니다. OpenSearch 이 상태의 도메인은 복원할 수 없습니다. 하지만 수동 스냅샷이 있는 경우 해당 스냅샷을 사용하여 도메인의 데이터를 새 도메인으로 마이그레이션할 수 있습니다. 콘솔에는 저장된 데이터를 암호화하는 도메인에 대해서만 이 지표가 표시됩니다.

관련 통계: Minimum, Maximum

InvalidHostHeaderRequests

유효하지 않은 (또는 누락된) OpenSearch 호스트 헤더가 포함된 클러스터에 대한 HTTP 요청 수입니다. 유효한 요청에는 호스트 헤더 값으로 도메인 호스트 이름이 포함됩니다. OpenSearch 서비스는 제한적인 액세스 정책이 없는 퍼블릭 액세스 도메인에 대한 잘못된 요청을 거부합니다. 모든 도메인에 제한적인 액세스 정책을 적용하는 것을 권장합니다.

이 지표의 값이 큰 경우 OpenSearch 클라이언트가 요청에 도메인 호스트 이름 (예: IP 주소 제외) 을 포함하는지 확인하십시오.

관련 통계: 합계

OpenSearchRequests (previously ElasticsearchRequests)

OpenSearch 클러스터에 대한 요청 수.

관련 통계: 합계

2xx, 3xx, 4xx, 5xx

도메인에 대한 요청 중 주어진 HTTP 응답 코드 (2 xx, 3 xx, 4 xx, 5 xx) 가 발생한 요청 수입니다.

관련 통계: 합계

ThroughputThrottle

디스크가 제한되었는지 여부를 나타냅니다. 제한은 ReadThroughputMicroBurstingWriteThroughputMicroBursting의 총 처리량이 최대 처리량 MaxProvisionedThroughput보다 높을 때 발생합니다. MaxProvisionedThroughput는 인스턴스 처리량 또는 프로비저닝된 볼륨 처리량 중 더 낮은 값입니다. 값이 1이면 디스크가 제한되었음을 나타냅니다. 값이 0이면 정상적인 동작 상태를 나타냅니다.

인스턴스 처리량에 대한 자세한 내용은 Amazon EBS 최적화 인스턴스를 참조하십시오. 볼륨 처리량에 대한 자세한 내용은 Amazon EBS 볼륨 유형을 참조하십시오.

관련 통계: Minimum, Maximum

IopsThrottle

도메인의 초당 입력/출력 작업 수 (IOPS) 가 제한되었는지 여부를 나타냅니다. 데이터 노드가 EBS 볼륨 또는 데이터 노드 IOPS 인스턴스의 최대 허용 한도를 위반하면 전송률 조절이 발생합니다. EC2

인스턴스에 대한 자세한 IOPS 내용은 Amazon EBS 최적화 인스턴스를 참조하십시오. 볼륨에 대한 자세한 IOPS 내용은 Amazon EBS 볼륨 유형을 참조하십시오.

관련 통계: Minimum, Maximum

HighSwapUsage

값이 1이면 페이지 오류로 인한 스와핑으로 인해 특정 기간 동안 기본 디스크 사용량이 급증했을 수 있습니다.

관련 통계: Maximum

전용 프라이머리 노드 지표입니다.

Amazon OpenSearch Service는 전용 마스터 노드에 대해 다음과 같은 지표를 제공합니다.

지표 설명
MasterCPUUtilization

전용 마스터 노드에서 사용하는 CPU 리소스의 최대 비율. 이 지표가 60%에 도달하면 인스턴스 유형의 크기를 늘리는 것이 좋습니다.

관련 통계: Maximum

MasterFreeStorageSpace

이 지표는 관련이 없으므로 무시해도 좋습니다. 이 서비스에서는 프라이머리 노드를 데이터 노드로 사용하지 않습니다.

MasterJVMMemoryPressure

클러스터의 모든 전용 프라이머리 노드에 사용되는 Java 힙의 최대 비율. 이 지표가 85%에 도달하면 더 큰 인스턴스 유형으로 이전하는 것이 좋습니다.

관련 통계: Maximum

참고

서비스 소프트웨어 R20220323에서 이 지표에 대한 로직이 변경되었습니다. 자세한 내용은 릴리스 정보를 참조하세요.

MasterOldGenJVMMemoryPressure

프라이머리 노드당 '구세대'에 사용된 Java 힙의 최대 비율입니다.

관련 통계: Maximum

MasterCPUCreditBalance

클러스터의 전용 마스터 노드에 사용할 수 있는 나머지 CPU 크레딧입니다. CPU크레딧은 1분 동안 풀 CPU 코어의 성능을 제공합니다. 자세한 내용은 Amazon EC2 개발자 안내서의 CPU 크레딧을 참조하십시오. 이 지표는 T2 인스턴스 유형에 대해서만 확인할 수 있습니다.

관련 통계: Minimum

MasterReachableFromNode

MasterNotDiscovered 예외에 대한 상태 확인입니다. 값이 1이면 정상적인 동작 상태를 나타냅니다. 값이 0이면 /_cluster/health/가 오류를 일으킨 것을 나타냅니다.

여기에서 오류란 소스 노드에서 프라이머리 노드에 도달할 수 없다는 것을 의미합니다. 일반적으로 네트워크 연결 문제 또는 보안 문제로 인해 발생합니다. AWS 종속성 문제.

관련 통계: Maximum

MasterSysMemoryUtilization

사용 중인 프라이머리 노드 메모리의 비율입니다.

관련 통계: Maximum

EBS볼륨 메트릭

Amazon OpenSearch Service는 EBS 볼륨에 대해 다음과 같은 지표를 제공합니다.

지표 설명
ReadLatency

EBS볼륨 읽기 작업의 지연 시간 (초). 이 지표는 개별 노드에도 사용할 수 있습니다.

관련 통계: 최소, 최대, 평균

WriteLatency

EBS볼륨에 대한 쓰기 작업의 지연 시간 (초). 이 지표는 개별 노드에도 사용할 수 있습니다.

관련 통계: 최소, 최대, 평균

ReadThroughput

EBS볼륨에 대한 읽기 작업의 처리량 (초당 바이트 수) 이 지표는 개별 노드에도 사용할 수 있습니다.

관련 통계: 최소, 최대, 평균

ReadThroughputMicroBursting

마이크로 버스팅을 고려한 EBS 볼륨 읽기 작업의 처리량 (초당 바이트) 입니다. 이 지표는 개별 노드에도 사용할 수 있습니다. 마이크로 버스팅은 EBS 볼륨이 상당히 짧은 시간 (1분 미만) 동안 높은 속도로 IOPS 버스트되거나 처리량이 높아질 때 발생합니다.

관련 통계: 최소, 최대, 평균

WriteThroughput

볼륨에 대한 쓰기 작업의 처리량 (초당 바이트 수) EBS 이 지표는 개별 노드에도 사용할 수 있습니다.

관련 통계: 최소, 최대, 평균

WriteThroughputMicroBursting

마이크로 버스팅을 고려한 EBS 볼륨의 쓰기 작업 처리량 (초당 바이트) 입니다. 이 지표는 개별 노드에도 사용할 수 있습니다. 마이크로 버스팅은 EBS 볼륨이 상당히 짧은 시간 (1분 미만) 동안 높은 IOPS 속도로 버스트되거나 처리량이 높은 경우 발생합니다.

관련 통계: 최소, 최대, 평균

DiskQueueDepth

볼륨에 대해 보류 중인 입출력 (I/O) 요청 수입니다. EBS

관련 통계: 최소, 최대, 평균

ReadIOPS

EBS볼륨에 대한 읽기 작업의 초당 입력 및 출력 (I/O) 작업 수입니다. 이 지표는 개별 노드에도 사용할 수 있습니다.

관련 통계: 최소, 최대, 평균

ReadIOPSMicroBursting

마이크로 버스팅을 고려할 때 EBS 볼륨의 읽기 작업에 대한 초당 입력 및 출력 (I/O) 작업 수입니다. 이 지표는 개별 노드에도 사용할 수 있습니다. 마이크로 버스팅은 EBS 볼륨이 상당히 짧은 시간 (1분 미만) 동안 고용량 IOPS 또는 처리량이 급증할 때 발생합니다.

관련 통계: 최소, 최대, 평균

WriteIOPS

볼륨에 대한 쓰기 작업의 초당 입력 및 출력 (I/O) 작업 수입니다. EBS 이 지표는 개별 노드에도 사용할 수 있습니다.

관련 통계: 최소, 최대, 평균

WriteIOPSMicroBursting

마이크로 버스팅을 고려할 때 EBS 볼륨에 대한 쓰기 작업의 초당 입력 및 출력 (I/O) 작업 수입니다. 이 지표는 개별 노드에도 사용할 수 있습니다. 마이크로 버스팅은 EBS 볼륨이 상당히 짧은 시간 (1분 미만) 동안 고용량 IOPS 또는 처리량이 급증할 때 발생합니다.

관련 통계: 최소, 최대, 평균

BurstBalance

볼륨의 버스트 버킷에 남아 있는 입력 및 출력 (I/O) 크레딧의 비율입니다. EBS 값이 100이면 볼륨에 최대 크레딧 수가 누적되었음을 의미합니다. 이 비율이 70% 미만으로 떨어지면 낮은 EBS 버스트 밸런스 섹션을 참조하세요. gp3 볼륨 유형이 있는 도메인과 볼륨 크기가 1000GiB를 초과하는 gp2 볼륨이 있는 도메인의 경우 버스트 균형은 0으로 유지됩니다.

관련 통계: 최소, 최대, 평균

인스턴스 지표

Amazon OpenSearch Service는 도메인의 각 인스턴스에 대해 다음과 같은 지표를 제공합니다. OpenSearch 또한 서비스는 이러한 인스턴스 지표를 집계하여 전체 클러스터 상태에 대한 통찰력을 제공합니다. 콘솔에서 Sample Count(샘플 수) 통계를 이용하여 이 동작을 확인할 수 있습니다. 다음 표의 각 지표는 노드 및 클러스터 관련 통계를 포함합니다.

중요

Elasticsearch 버전마다 다른 스레드 풀을 사용하여 에 대한 호출을 처리합니다. _index API Elasticsearch 1.5 및 2.3은 인덱스 스레드 풀을 사용합니다. 엘라스틱서치 5. x, 6.0, 6.2는 벌크 스레드 풀을 사용합니다. OpenSearch 그리고 Elasticsearch 6.3 이상에서는 쓰기 스레드 풀을 사용합니다. 현재 OpenSearch 서비스 콘솔에는 벌크 스레드 풀에 대한 그래프가 포함되어 있지 않습니다.

GET _cluster/settings?include_defaults=true를 사용하여 클러스터의 스레드 풀과 대기열 크기를 확인합니다.

지표 설명
ConcurrentSearchRate

데이터 노드의 모든 샤드에 대해 분당 동시 세그먼트 검색을 사용한 검색 요청의 총 수입니다. 를 한 번 호출해도 여러 _search API 샤드의 결과가 반환될 수 있습니다. 이러한 샤드 중 5개가 한 노드에 있는 경우, 클라이언트가 단 한 개만 요청했더라도 노드는 이 지표에 대해 5를 보고할 것입니다.

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum, Sum

ConcurrentSearchLatency

분 N에서 분 사이 (N-1) 사이의 노드에서 동시 세그먼트 검색을 사용하여 모든 검색에 소요된 총 시간 차이 (밀리초) 입니다.

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum

IndexingLatency

한 노드의 모든 인덱싱 작업에 소요된 총 시간 차이(밀리초)로, 이 차이는 분 N에서 (N-1)분입니다.

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum

IndexingRate

분당 인덱싱 작업 수입니다. 를 한 번 호출하면 문서 두 개가 추가되고 두 개가 네 번의 작업으로 계산되어 하나 이상의 노드에 분산될 수 있습니다. _bulk API 해당 인덱스에 하나 이상의 복제본이 있고 최적화된 인스턴스가 없는 OpenSearch 도메인에 있는 경우 클러스터의 다른 노드도 총 네 개의 인덱싱 작업을 기록합니다. 최적화된 인스턴스가 있는 OpenSearch 도메인의 경우 복제본이 있는 다른 노드에서는 작업을 기록하지 않습니다. 문서 삭제는 이 지표에 포함되지 않습니다.

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum, Sum

SearchLatency

한 노드의 모든 검색 작업에 소요된 총 시간 차이(밀리초)로, 이 차이는 분 N에서 (N-1)분입니다.

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum

SearchRate

한 데이터 노드의 모든 샤드에 대한 분당 검색 요청의 총 수입니다. 를 한 번 호출해도 여러 샤드의 결과가 _search API 반환될 수 있습니다. 이러한 샤드 중 5개가 한 노드에 있는 경우, 클라이언트가 단 한 개만 요청했더라도 노드는 이 지표에 대해 5를 보고할 것입니다.

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum, Sum

SegmentCount

데이터 노드의 세그먼트 수입니다. 세그먼트가 많을수록 각 검색에 소요되는 시간이 길어집니다. OpenSearch 작은 세그먼트를 큰 세그먼트로 병합하는 경우가 있습니다.

관련 노드 통계: Maximum, Average

관련 클러스터 통계: Sum, Maximum, Average

SysMemoryUtilization

사용 중인 인스턴스 메모리의 비율(%)입니다. 이 지표의 값이 큰 것은 정상이며 일반적으로 클러스터에 문제가 있음을 나타내지 않습니다. 잠재적인 성능 및 안정성 문제에 대한 더 나은 지표는 JVMMemoryPressure 지표를 참조하세요.

관련 노드 통계: Minimum, Maximum, Average

관련 클러스터 통계: Minimum, Maximum, Average

JVMGCYoungCollectionCount

"신세대" 가비지 수집이 실행된 횟수입니다. 클러스터 작업은 일반적으로 실행 수가 계속 증가하여 커집니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

JVMGCYoungCollectionTime

클러스터가 "신세대" 가비지 수집을 수행하는 데 소비 한 시간(밀리초)입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

JVMGCOldCollectionCount

"구세대" 가비지 수집이 실행된 횟수입니다. 리소스가 충분한 클러스터에서는 이 수가 적게 유지되고 자주 증가하지 않습니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

JVMGCOldCollectionTime

클러스터가 "구세대" 가비지 수집을 수행하는 데 소비 한 시간 (밀리초)입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

OpenSearchDashboardsConcurrentConnections

대시보드에 대한 활성 동시 연결 수 OpenSearch 이 수가 계속 증가하면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

OpenSearchDashboardsHealthyNode

개별 OpenSearch 대시보드 노드의 상태 점검. 값이 1이면 정상적인 동작 상태를 나타냅니다. 값이 0이면 Dashboards에 액세스할 수 없다는 것을 나타냅니다.

관련 노드 통계: Minimum

관련 클러스터 통계: Minimum, Maximum, Average

OpenSearchDashboardsHeapTotal

OpenSearch 대시보드에 할당된 힙 메모리의 양 (MiB) 다양한 EC2 인스턴스 유형이 정확한 메모리 할당에 영향을 미칠 수 있습니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

OpenSearchDashboardsHeapUsed

OpenSearch 대시보드에서 사용하는 힙 메모리의 절대량 (MiB)

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

OpenSearchDashboardsHeapUtilization

대시보드에서 사용하는 사용 가능한 힙 메모리의 최대 비율입니다. OpenSearch 이 값이 80% 이상으로 증가하면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Minimum, Maximum, Average

OpenSearchDashboardsOS1MinuteLoad

대시보드의 평균 CPU 로드 시간은 1분입니다. OpenSearch CPU부하가 1.00 미만으로 유지되는 것이 이상적입니다. 일시적인 급증은 정상이지만 이 지표가 지속해서 1.00을 초과할 경우 인스턴스 유형의 크기를 늘리는 것이 좋습니다.

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum

OpenSearchDashboardsRequestTotal

OpenSearch 대시보드에 대한 총 HTTP 요청 수입니다. 시스템 속도가 느리거나 Dashboards 요청 수가 많으면 인스턴스 유형의 크기를 늘리는 것을 고려합니다.

관련 노드 통계: Sum

관련 클러스터 통계: Sum

OpenSearchDashboardsResponseTimesMaxInMillis

OpenSearch 대시보드가 요청에 응답하는 데 걸리는 최대 시간 (밀리초) 요청 결과가 반환되는 데 시간이 지속해서 오래 걸리는 경우 인스턴스 유형의 크기를 늘리는 것을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Maximum, Average

SearchTaskCancelled

코디네이터 노드 취소 횟수.

관련 노드 통계: Sum

관련 클러스터 통계: Sum

SearchShardTaskCancelled

데이터 노드 취소 횟수.

관련 노드 통계: Sum

관련 클러스터 통계: Sum,

ThreadpoolForce_mergeQueue

강제 병합 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

ThreadpoolForce_mergeRejected

강제 병합 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum

ThreadpoolForce_mergeThreads

강제 병합 스레드 풀의 크기입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

ThreadpoolIndexQueue

인덱스 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 인덱스 대기열의 최대 크기는 200입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

ThreadpoolIndexRejected

인덱스 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum

ThreadpoolIndexThreads

인덱스 스레드 풀의 크기입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

ThreadpoolSearchQueue

검색 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 검색 대기열의 최대 크기는 1,000입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

ThreadpoolSearchRejected

검색 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum

ThreadpoolSearchThreads

검색 스레드 풀의 크기입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

Threadpoolsql-workerQueue

검색 스레드 풀에서 대기열에 있는 작업의 SQL 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

Threadpoolsql-workerRejected

SQL검색 스레드 풀에서 거부된 작업 수 이 수가 계속 증가하면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum

Threadpoolsql-workerThreads

SQL검색 스레드 풀의 크기.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

ThreadpoolBulkQueue

벌크 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

ThreadpoolBulkRejected

벌크 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum

ThreadpoolBulkThreads

벌크 스레드 풀의 크기입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

ThreadpoolIndexSearcherQueue

인덱스 검색기 스레드 풀에서 대기열에 있는 작업의 수입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

ThreadpoolIndexSearcherRejected

색인 검색기 스레드 풀에서 거부된 작업 수입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum

ThreadpoolIndexSearcherThreads

색인 검색기 스레드 풀의 크기.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

ThreadpoolWriteThreads

쓰기 스레드 풀의 크기입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

ThreadpoolWriteQueue

쓰기 스레드 풀에서 대기 중인 작업의 수입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

ThreadpoolWriteRejected

쓰기 스레드 풀에서 거부된 작업의 수입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

참고

버전 7.1에서 기본 쓰기 대기열 크기가 200에서 10000으로 증가했기 때문에 이 지표는 더 이상 Service의 거부를 나타내는 유일한 지표가 아닙니다. OpenSearch CoordinatingWriteRejected, PrimaryWriteRejected, ReplicaWriteRejected 지표를 사용하여 7.1 및 이후 버전에서 거부를 모니터링합니다.

CoordinatingWriteRejected

마지막 서비스 프로세스 시작 이후 인덱싱 압박으로 인해 조정 노드에서 발생한 총 거부 수입니다. OpenSearch

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

이 지표는 버전 7.1 및 이후 버전에서 사용할 수 있습니다.

PrimaryWriteRejected

마지막 서비스 프로세스 시작 이후 인덱싱 압력으로 인해 기본 샤드에서 발생한 총 거부 건수입니다. OpenSearch

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

이 지표는 버전 7.1 및 이후 버전에서 사용할 수 있습니다.

ReplicaWriteRejected

마지막 서비스 프로세스 시작 이후 인덱싱 압박으로 인해 복제본 샤드에서 발생한 총 거부 건수입니다. OpenSearch

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

이 지표는 버전 7.1 및 이후 버전에서 사용할 수 있습니다.

UltraWarm 메트릭

Amazon OpenSearch Service는 UltraWarm노드에 대해 다음과 같은 지표를 제공합니다.

지표 설명
WarmCPUUtilization

클러스터 내 UltraWarm 노드 CPU 사용률. 최대값은 CPU 사용량이 가장 많은 노드를 나타냅니다. 평균은 클러스터의 모든 UltraWarm 노드를 나타냅니다. 이 지표는 개별 UltraWarm 노드에도 사용할 수 있습니다.

관련 통계: Maximum, Average

WarmFreeStorageSpace

사용 가능한 웜 스토리지 공간(MiB)입니다. 연결된 디스크가 아닌 Amazon S3를 UltraWarm 사용하는 Sum 것이 유일한 관련 통계이기 때문입니다. 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다.

관련 통계: 합계

WarmSearchableDocuments

클러스터의 모든 웜 인덱스에서 검색 가능한 총 문서 수입니다. 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다.

관련 통계: 합계

WarmSearchLatency

분 N에서 분 (N-1) UltraWarm 사이의 모든 검색에 소요된 총 시간 차이 (밀리초).

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum

WarmSearchRate

노드에 있는 모든 샤드에 대한 분당 총 검색 요청 수입니다. UltraWarm 를 한 번 호출하면 여러 샤드의 결과가 _search API 반환될 수 있습니다. 이러한 샤드 중 5개가 한 노드에 있는 경우, 클라이언트가 단 한 개만 요청했더라도 노드는 이 지표에 대해 5를 보고할 것입니다.

관련 노드 통계: Average

관련 클러스터 통계: Average, Maximum, Sum

WarmStorageSpaceUtilization

클러스터가 사용 중인 총 웜 스토리지 공간 크기(MiB)입니다.

관련 통계: Maximum

HotStorageSpaceUtilization

클러스터를 사용 중인 총 핫 스토리지 공간 크기입니다.

관련 통계: Maximum

WarmSysMemoryUtilization

사용 중인 웜 노드 메모리의 비율입니다.

관련 통계: Maximum

HotToWarmMigrationQueueSize

현재 핫 스토리지에서 웜 스토리지로의 마이그레이션을 기다리는 인덱스 수입니다.

관련 통계: Maximum

WarmToHotMigrationQueueSize

현재 웜 스토리지에서 핫 스토리지로의 마이그레이션을 기다리는 인덱스 수입니다.

관련 통계: Maximum

HotToWarmMigrationFailureCount

실패한 핫-웜 마이그레이션의 총 수입니다.

관련 통계: 합계

HotToWarmMigrationForceMergeLatency

마이그레이션 프로세스의 강제 병합 단계의 평균 대기 시간입니다. 이 단계가 일관되게 너무 오래 걸리면 index.ultrawarm.migration.force_merge.max_num_segments를 늘리는 것을 고려합니다.

관련 통계: Average

HotToWarmMigrationSnapshotLatency

마이그레이션 프로세스 중 스냅샷 단계의 평균 대기 시간입니다. 이 단계가 일관되게 너무 오래 걸리면 샤드의 크기가 적절하게 조정되고 클러스터 전체에 분산되어 있는지 확인합니다.

관련 통계: Average

HotToWarmMigrationProcessingLatency

성공한 핫-웜 마이그레이션의 평균 대기 시간으로, 대기열에서 소요된 시간을 포함하지 않습니다. 이 값은 마이그레이션 프로세스의 강제 병합, 스냅샷 및 샤드 재배치 단계를 완료하는 데 걸리는 시간의 합계입니다.

관련 통계: Average

HotToWarmMigrationSuccessCount

성공한 핫-웜 마이그레이션의 총 수입니다.

관련 통계: 합계

HotToWarmMigrationSuccessLatency

성공한 핫-웜 마이그레이션의 평균 대기 시간으로, 대기열에서 소요된 시간을 포함합니다.

관련 통계: Average

WarmThreadpoolSearchThreads

UltraWarm 검색 스레드 풀의 크기.

관련 노드 통계: Maximum

관련 클러스터 통계: Average, Sum

WarmThreadpoolSearchRejected

UltraWarm 검색 스레드 풀에서 거부된 작업 수 이 수가 계속 늘어난다면 UltraWarm 노드를 더 추가해 보세요.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum

WarmThreadpoolSearchQueue UltraWarm 검색 스레드 풀의 대기열에 있는 작업 수 대기열 크기가 계속 크면 노드를 더 UltraWarm 추가하는 것을 고려해 보세요.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

WarmJVMMemoryPressure

UltraWarm노드에 사용된 Java 힙의 최대 비율입니다.

관련 통계: Maximum

참고

서비스 소프트웨어 R20220323에서 이 지표에 대한 로직이 변경되었습니다. 자세한 내용은 릴리스 정보를 참조하세요.

WarmOldGenJVMMemoryPressure

노드당 UltraWarm “이전 세대”에 사용된 Java 힙의 최대 비율입니다.

관련 통계: Maximum

WarmJVMGCYoungCollectionCount

“젊은 세대”의 가비지 컬렉션이 UltraWarm 노드에서 실행된 횟수입니다. 클러스터 작업은 일반적으로 실행 수가 계속 증가하여 커집니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

WarmJVMGCYoungCollectionTime

클러스터가 UltraWarm 노드에서 “젊은 세대” 가비지 컬렉션을 수행하는 데 소요한 시간 (밀리초) 입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

WarmJVMGCOldCollectionCount

“이전 세대” 가비지 컬렉션이 UltraWarm 노드에서 실행된 횟수입니다. 리소스가 충분한 클러스터에서는 이 수가 적게 유지되고 자주 증가하지 않습니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

WarmConcurrentSearchRate

노드에 있는 모든 샤드에 대해 분당 동시 세그먼트 검색을 사용한 총 검색 요청 수입니다. UltraWarm 를 한 번 호출하면 다양한 _search API 샤드의 결과가 반환될 수 있습니다. 이러한 샤드 중 5개가 한 노드에 있는 경우, 클라이언트가 단 한 개만 요청했더라도 노드는 이 지표에 대해 5를 보고할 것입니다.

관련 노드 통계: Average

관련 클러스터 통계: Sum, Maximum, Average

WarmConcurrentSearchLatency

분 N에서 분 사이 (N-1) 사이의 UltraWarm 노드에서 동시 세그먼트 검색을 사용하여 모든 검색에 소요된 총 시간 차이 (밀리초) 입니다.

관련 노드 통계: Average

관련 클러스터 통계: Maximum, Average

WarmThreadpoolIndexSearcherQueue

색인 검색기 스레드 풀에서 대기열에 있는 작업의 UltraWarm 수입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum, Maximum, Average

WarmThreadpoolIndexSearcherRejected

UltraWarm 색인 검색기 스레드 풀에서 거부된 작업 수입니다.

관련 노드 통계: Maximum

관련 클러스터 통계: Sum

WarmThreadpoolIndexSearcherThreads

UltraWarm 색인 검색기 스레드 풀의 크기.

관련 노드 통계: Maximum

관련 클러스터 통계: 합계, 평균

콜드 스토리지 지표

Amazon OpenSearch Service는 콜드 스토리지에 대해 다음과 같은 지표를 제공합니다.

지표 설명
ColdStorageSpaceUtilization

클러스터를 사용 중인 총 콜드 스토리지 공간 크기(MiB)입니다.

관련 통계: 최대

ColdToWarmMigrationFailureCount

실패한 콜드-웜 마이그레이션의 총 수입니다.

관련 통계: 합계

ColdToWarmMigrationLatency

콜드-웜 마이그레이션을 성공적으로 완료하는 데 걸리는 시간입니다.

관련 통계: Average

ColdToWarmMigrationQueueSize

현재 콜드 스토리지에서 웜 스토리지로의 마이그레이션을 기다리는 인덱스 수입니다.

관련 통계: Maximum

ColdToWarmMigrationSuccessCount

성공한 콜드-웜 마이그레이션의 총 수입니다.

관련 통계: 합계

WarmToColdMigrationFailureCount

실패한 웜-콜드 마이그레이션의 총 수입니다.

관련 통계: 합계

WarmToColdMigrationLatency

웜-콜드 마이그레이션을 성공적으로 완료하는 데 걸리는 시간입니다.

관련 통계: Average

WarmToColdMigrationQueueSize

현재 웜 스토리지에서 콜드 스토리지로의 마이그레이션을 기다리는 인덱스 수입니다.

관련 통계: Maximum

WarmToColdMigrationSuccessCount

성공한 웜-콜드 마이그레이션의 총 수입니다.

관련 통계: 합계

OR1지표

Amazon OpenSearch 서비스는 OR1인스턴스에 대해 다음과 같은 지표를 제공합니다.

지표 설명
RemoteStorageUsedSpace

클러스터가 사용 중인 총 Amazon S3 공간 크기(MiB)입니다.

관련 통계: 합계

RemoteStorageWriteRejected

원격 스토리지 및 복제 압력으로 인해 기본 샤드에서 거부된 총 요청 수입니다. 이는 마지막 OpenSearch 서비스 프로세스 시작부터 시작하여 계산됩니다.

관련 통계: 합계

ReplicationLagMaxTime

복제본 샤드가 기본 샤드보다 뒤쳐지는 시간 (밀리초)

관련 통계: Maximum

알림 지표

Amazon OpenSearch Service는 알림에 대해 다음과 같은 지표를 제공합니다.

지표 설명
AlertingDegraded

값이 1이면 알림 인덱스가 빨간색이거나 하나 이상의 노드가 일정에 따라 실행되지 않음을 의미하고, 값이 0이면 정상적인 동작 상태를 나타냅니다.

관련 통계: Maximum

AlertingIndexExists

값이 1이면 .opensearch-alerting-config 인덱스가 존재함을 의미하고, 값이 0이면 존재하지 않음을 의미합니다. 알림 기능을 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: Maximum

AlertingIndexStatus.green

인덱스의 상태입니다. 값이 1이면 녹색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 녹색이 아님을 의미합니다.

관련 통계: Maximum

AlertingIndexStatus.red

인덱스의 상태입니다. 값이 1이면 빨간색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 빨간색이 아님을 의미합니다.

관련 통계: Maximum

AlertingIndexStatus.yellow

인덱스의 상태입니다. 값이 1이면 노란색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 노란색이 아님을 의미합니다.

관련 통계: Maximum

AlertingNodesNotOnSchedule

값이 1이면 일부 작업이 일정에 따라 실행되고 있지 않음을 의미하고, 값이 0이면 모든 알림 작업이 일정에 따라 실행 중이거나 알림 작업이 없음을 의미합니다. OpenSearch 서비스 콘솔을 확인하거나 _nodes/stats 요청하여 리소스 사용량이 많은 노드가 있는지 확인하십시오.

관련 통계: Maximum

AlertingNodesOnSchedule

값이 1이면 모든 알림 작업이 일정에 따라 실행 중이거나 알림 작업이 없음을 의미하고, 값이 0이면 일부 작업이 일정에 따라 실행되고 있지 않음을 의미합니다.

관련 통계: Maximum

AlertingScheduledJobEnabled

값이 1이면 opensearch.scheduled_jobs.enabled 클러스터 설정이 true임을 의미하고, 값이 0이면 false이며 예약된 작업이 비활성화되었음을 의미합니다.

관련 통계: Maximum

이상 탐지 지표

Amazon OpenSearch Service는 예외 항목 탐지를 위해 다음과 같은 지표를 제공합니다.

지표 설명
ADPluginUnhealthy

값이 1이면 실패 횟수가 많거나 사용하는 인덱스 중 하나가 빨간색이기 때문에 이상 탐지 플러그 인이 제대로 작동하지 않음을 의미합니다. 값이 0이면 플러그인이 예상대로 작동하고 있음을 나타냅니다.

관련 통계: Maximum

ADExecuteRequestCount

이상을 탐지하기 위한 요청 수입니다.

관련 통계: 합계

ADExecuteFailureCount

이상을 탐지하기 위한 실패한 요청 수입니다.

관련 통계: 합계

ADHCExecuteFailureCount

높은 카디널리티 탐지기를 위한 이상 탐지 요청 중 실패한 요청 수입니다.

관련 통계: 합계

ADHCExecuteRequestCount

높은 카디널리티 탐지기를 위한 이상 탐지 요청 수입니다.

관련 통계: 합계

ADAnomalyResultsIndexStatusIndexExists

값이 1이면 .opensearch-anomaly-results 별칭이 가리키는 인덱스가 존재함을 의미합니다. 이상 탐지를 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: Maximum

ADAnomalyResultsIndexStatus.red

값이 1이면 .opensearch-anomaly-results 별칭이 가리키는 인덱스가 빨간색임을 의미합니다. 값이 0이면 그렇지 않음을 의미합니다. 이상 탐지를 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: Maximum

ADAnomalyDetectorsIndexStatusIndexExists

값이 1이면 .opensearch-anomaly-detectors 인덱스가 존재함을 의미하고, 값이 0이면 존재하지 않음을 의미합니다. 이상 탐지를 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: Maximum

ADAnomalyDetectorsIndexStatus.red

값이 1이면 .opensearch-anomaly-detectors 인덱스가 빨간색임을 의미합니다. 값이 0이면 그렇지 않음을 의미합니다. 이상 탐지를 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: Maximum

ADModelsCheckpointIndexStatusIndexExists

값이 1이면 .opensearch-anomaly-checkpoints 인덱스가 존재함을 의미하고, 값이 0이면 존재하지 않음을 의미합니다. 이상 탐지를 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: Maximum

ADModelsCheckpointIndexStatus.red

값이 1이면 .opensearch-anomaly-checkpoints 인덱스가 빨간색임을 의미합니다. 값이 0이면 그렇지 않음을 의미합니다. 이상 탐지를 처음 사용할 때까지 이 값은 0으로 유지됩니다.

관련 통계: Maximum

Amazon OpenSearch Service는 비동기 검색에 대해 다음과 같은 지표를 제공합니다.

비동기 검색 코디네이터 노드 통계(코디네이터 노드당)

지표 설명
AsynchronousSearchSubmissionRate

지난 1분 동안 제출된 비동기 검색 수입니다.

AsynchronousSearchInitializedRate

지난 1분 동안 제출된 비동기 검색 수입니다.

AsynchronousSearchRunningCurrent

현재 실행 중인 비동기 검색 수입니다.

AsynchronousSearchCompletionRate

지난 1분 동안 성공적으로 완료한 비동기 검색 수입니다.

AsynchronousSearchFailureRate

지난 1분 동안 완료 및 실패한 비동기 검색 수입니다.

AsynchronousSearchPersistRate

지난 1분 동안 지속된 비동기 검색 수입니다.

AsynchronousSearchPersistFailedRate

지난 1분 동안 지속되지 못한 비동기 검색 수입니다.

AsynchronousSearchRejected

노드 작동 시간 이후 거부된 총 비동기 검색 수입니다.

AsynchronousSearchCancelled

노드 작동 시간 이후 취소된 총 비동기 검색 수입니다.

AsynchronousSearchMaxRunningTime

지난 1분 동안 노드에서 가장 오래 실행되는 비동기 검색의 지속 시간입니다.

비동기 검색 클러스터 통계

지표 설명
AsynchronousSearchStoreHealth

최근 1분간의 지속형 인덱스 (RED/non-RED) 내 스토어 상태

AsynchronousSearchStoreSize

지난 1분 동안 모든 샤드에 있는 시스템 인덱스의 크기입니다.

AsynchronousSearchStoredResponseCount

지난 1분 동안 시스템 인덱스에 저장된 응답 수입니다.

지표 자동 조정

Amazon OpenSearch 서비스는 자동 조정에 대해 다음과 같은 지표를 제공합니다.

지표 설명
AutoTuneChangesHistoryHeapSize

힙 크기 조정 값에 대한 MiB 변경 기록.

AutoTuneChangesHistoryJVMYoungGenArgs

JVM YongGen 인수에 대한 변경 기록.

AutoTuneFailed

자동 조정 변경에 실패했는지 여부를 나타내는 부울입니다.

AutoTuneSucceeded

자동 조정 변경에 성공했는지 여부를 나타내는 부울입니다.

AutoTuneValue 무중단 변경에 대한 대기열 변경 기록(개수) 및 캐시 조정 변경 기록(MiB 단위).

Multi-AZ with Standby 지표

Amazon OpenSearch Service는 대기 모드가 있는 다중 AZ에 대해 다음과 같은 지표를 제공합니다.

활성 가용 영역의 데이터 노드에 대한 노드 수준 지표

지표 설명
CPUUtilization 클러스터의 데이터 노드 CPU 사용률. 최대값은 CPU 사용량이 가장 많은 노드를 나타냅니다. 평균은 클러스터의 모든 노드를 나타냅니다. 이 지표는 개별 노드에도 사용할 수 있습니다.
FreeStorageSpace

클러스터에서 사용할 수 있는 데이터 노드 공간입니다. Sum은 클러스터의 사용 가능한 전체 공간을 표시하지만, 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다. Minimum, Maximum은 사용 가능한 공간이 가장 작은 노드와 가장 큰 노드를 각각 표시합니다. 이 지표는 개별 노드에서도 사용할 수 있습니다. OpenSearch 이 지표에 ClusterBlockException 0 도달하면 서비스에서 a가 발생합니다. 복구하려면 인덱스를 삭제하거나, 더 큰 인스턴스를 추가하거나, 기존 인스턴스에 EBS 기반 스토리지를 추가해야 합니다. 자세한 내용은 사용 가능한 스토리지 공간 부족을 참조하십시오.

OpenSearch 서비스 콘솔은 이 값을 GiB 단위로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다.

JVMMemoryPressure 클러스터의 모든 데이터 노드에 사용된 Java 힙의 최대 비율입니다. OpenSearch 서비스는 인스턴스의 절반을 Java RAM 힙에 사용하며, 힙 크기는 최대 32GiB입니다. 인스턴스를 수직으로 최대 RAM 64GiB까지 확장할 수 있으며, 이때 인스턴스를 추가하여 수평으로 확장할 수 있습니다. 아마존 OpenSearch 서비스를 위한 권장 CloudWatch 알람을 참조하세요.
SysMemoryUtilization 사용 중인 인스턴스 메모리의 비율(%)입니다. 이 지표의 값이 큰 것은 정상이며 일반적으로 클러스터에 문제가 있음을 나타내지 않습니다. 잠재적인 성능 및 안정성 문제에 대한 더 나은 지표는 JVMMemoryPressure 지표를 참조하세요.
IndexingLatency

한 노드의 모든 인덱싱 작업에 소요된 총 시간 차이(밀리초)로, 이 차이는 분 N에서 (N-1)분입니다.

IndexingRate 분당 인덱싱 작업 수입니다.
SearchLatency

한 노드의 모든 검색 작업에 소요된 총 시간 차이(밀리초)로, 이 차이는 분 N에서 (N-1)분입니다.

SearchRate 한 데이터 노드의 모든 샤드에 대한 분당 검색 요청의 총 수입니다.
ThreadpoolSearchQueue 검색 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 검색 대기열의 최대 크기는 1,000입니다.
ThreadpoolWriteQueue 쓰기 스레드 풀에서 대기 중인 작업의 수입니다.
ThreadpoolSearchRejected

검색 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다.

ThreadpoolWriteRejected 쓰기 스레드 풀에서 거부된 작업의 수입니다.

활성 가용 영역의 클러스터에 대한 클러스터 수준 지표

지표 설명
DataNodes 활성 및 대기 샤드의 총 수입니다.
DataNodesShards.active 활성 기본 및 복제본 샤드의 총 수입니다.
DataNodesShards.unassigned

클러스터의 노드에 할당되지 않은 샤드 수입니다.

DataNodesShards.initializing 초기화 중인 샤드 수입니다.
DataNodesShards.relocating 재배치 중인 샤드 수입니다.

가용 영역 회전 지표

ActiveReads.Availability-Zone = 1인 경우 영역이 활성 상태입니다. ActiveReads.Availability-Zone = 0인 경우 영역이 대기 상태입니다.

특정 시점 지표

Amazon OpenSearch Service는 특정 시점 (PIT) 검색에 대해 다음과 같은 지표를 제공합니다.

PIT코디네이터 노드 통계 (코디네이터 노드별)

지표 설명
CurrentPointInTime 노드의 활성 PIT 검색 컨텍스트 수
TotalPointInTime 노드 가동 시간 이후 만료된 PIT 검색 컨텍스트 수입니다.
AvgPointInTimeAliveTime 노드 가동 시간 이후 PIT 검색 컨텍스트의 평균 유지 횟수입니다.
HasActivePointInTime 값이 1이면 노드 가동 시간 이후 노드에 활성 PIT 컨텍스트가 있음을 나타냅니다. 값이 0이면 없는 것입니다.
HasUsedPointInTime 값이 1이면 노드 가동 시간 이후 노드에 만료된 PIT 컨텍스트가 있음을 나타냅니다. 값이 0이면 없는 것입니다.

SQL메트릭

Amazon OpenSearch 서비스는 SQL지원을 위해 다음과 같은 지표를 제공합니다.

지표 설명
SQLFailedRequestCountByCusErr

클라이언트 문제로 인해 _sql API 실패한 요청의 수입니다. 예를 들어 요청으로 인해 HTTP 상태 코드 400이 반환될 수 IndexNotFoundException 있습니다.

관련 통계: 합계

SQLFailedRequestCountBySysErr

서버 문제 또는 기능 제한으로 인해 실패한 요청의 수입니다. _sql API 예를 들어 a로 인해 요청에서 HTTP 상태 코드 503이 반환될 수 있습니다VerificationException.

관련 통계: 합계

SQLRequestCount

에 대한 요청 수입니다. _sql API

관련 통계: 합계

SQLDefaultCursorRequestCount

SQLRequestCount와 유사하지만 페이지 매김 요청만 계산합니다.

관련 통계: 합계

SQLUnhealthy

값이 1이면 SQL 플러그인이 특정 요청에 대한 응답으로 5개의 xx 응답 코드를 반환하거나 잘못된 DSL 쿼리를 OpenSearch 전달하고 있음을 나타냅니다. 다른 요청은 계속 성공합니다. 값이 0이면 최근 실패가 없음을 나타냅니다. 지속해서 값이 1이면 클라이언트가 플러그인에 수행하는 요청 문제를 해결합니다.

관련 통계: Maximum

k-NN 지표

Amazon OpenSearch Service에는 k-최근접이웃 (k-NN) 플러그인에 대한 다음 지표가 포함되어 있습니다.

지표 설명
KNNCacheCapacityReached

캐시 용량에 도달했는지에 대한 노드별 지표입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: Maximum

KNNCircuitBreakerTriggered

회로 차단기가 트리거되는지 여부에 대한 클러스터별 지표입니다. 어떤 노드가 KNNCacheCapacityReached에 대한 1의 값을 반환하는 경우 이 값도 1을 반환합니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: Maximum

KNNEvictionCount

메모리 제약 조건 또는 유휴 시간으로 인해 캐시에서 제거된 그래프 수에 대한 노드별 지표입니다. 인덱스 삭제로 인해 발생하는 명시적 제거는 계산되지 않습니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: 합계

KNNGraphIndexErrors

문서의 knn_vector 필드를 오류를 생성한 그래프에 추가하려는 요청 수에 대한 노드별 지표입니다.

관련 통계: 합계

KNNGraphIndexRequests

문서의 knn_vector 필드를 그래프에 추가하려는 요청 수에 대한 노드별 지표입니다.

관련 통계: 합계

KNNGraphMemoryUsage

현재 캐시 크기(메모리에 있는 모든 그래프의 총 크기)에 대한 노드별 지표입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: Average

KNNGraphQueryErrors

오류를 생성한 그래프 쿼리 수에 대한 노드별 지표입니다.

관련 통계: 합계

KNNGraphQueryRequests

그래프 쿼리 수에 대한 노드별 지표입니다.

관련 통계: 합계

KNNHitCount

캐시 적중 수에 대한 노드별 지표입니다. 캐시 적중은 사용자가 이미 메모리에 로드된 그래프를 쿼리할 때 발생합니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: 합계

KNNLoadExceptionCount

그래프를 캐시로 로드하려고 시도하는 동안 예외가 발생한 횟수에 대한 노드별 지표입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: 합계

KNNLoadSuccessCount

플러그인이 그래프를 캐시에 성공적으로 로드한 횟수에 대한 노드별 지표입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: 합계

KNNMissCount

캐시 누락 수에 대한 노드별 지표입니다. 캐시 누락은 사용자가 아직 메모리에 로드되지 않은 그래프를 쿼리할 때 발생합니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: 합계

KNNQueryRequests

k-NN 플러그인이 받은 쿼리 요청 수에 대한 노드별 지표입니다.

관련 통계: 합계

KNNScriptCompilationErrors

스크립트 컴파일 중 오류 수에 대한 노드별 지표입니다. 이 통계는 k-NN 점수 스크립트 검색에만 관련이 있습니다.

관련 통계: 합계

KNNScriptCompilations

k-NN 스크립트가 컴파일된 횟수에 대한 노드별 지표입니다. 이 값은 일반적으로 1 또는 0이어야 하지만 컴파일된 스크립트가 포함된 캐시가 채워지면 k-NN 스크립트가 다시 컴파일될 수 있습니다. 이 통계는 k-NN 점수 스크립트 검색에만 관련이 있습니다.

관련 통계: 합계

KNNScriptQueryErrors

스크립트 쿼리 중 오류 수에 대한 노드별 지표입니다. 이 통계는 k-NN 점수 스크립트 검색에만 관련이 있습니다.

관련 통계: 합계

KNNScriptQueryRequests

총 스크립트 쿼리 수에 대한 노드별 지표입니다. 이 통계는 k-NN 점수 스크립트 검색에만 관련이 있습니다.

관련 통계: 합계

KNNTotalLoadTime

k-NN이 그래프를 캐시로 로드하는 데 소요된 시간(나노초)입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다.

관련 통계: 합계

Amazon OpenSearch Service는 클러스터 간 검색에 대해 다음과 같은 지표를 제공합니다.

소스 도메인 지표

지표 차원 설명
CrossClusterOutboundConnections

ConnectionId

연결된 노드 수입니다. 응답에 하나 이상의 건너뛴 도메인이 포함된 경우 이 지표를 사용하여 비정상 연결을 추적합니다. 이 숫자가 0으로 떨어지면 연결이 비정상입니다.

CrossClusterOutboundRequests

ConnectionId

대상 도메인으로 전송된 검색 요청 수입니다. 클러스터 간 검색 요청의 부하가 도메인을 압도하고 있는지 확인하는 데 사용합니다. 이 지표의 스파이크를/스파이크와 연관시키십시오. JVM CPU

대상 도메인 지표

지표 차원 설명
CrossClusterInboundRequests

ConnectionId

소스 도메인에서 받은 수신 연결 요청 수입니다.

연결이 예기치 않게 끊어지는 경우를 대비하여 CloudWatch 경보를 추가하십시오. 경보를 만드는 단계는 정적 임계값 기반 CloudWatch 경보 만들기를 참조하십시오.

클러스터 간 복제 지표

Amazon OpenSearch Service는 클러스터 간 복제에 대해 다음과 같은 지표를 제공합니다.

지표 설명
ReplicationRate

초당 평균 복제 작업 속도. 이 지표는 IndexingRate 지표와 유사합니다.

LeaderCheckPoint

특정 연결에 대한 모든 복제 인덱스에 걸친 리더 체크포인트의 합계입니다. 이 지표를 사용하여 복제 대기 시간을 측정할 수 있습니다.

FollowerCheckPoint

특정 연결에 대한 모든 복제 인덱스에 걸친 팔로워 체크포인트의 합계입니다. 이 지표를 사용하여 복제 대기 시간을 측정할 수 있습니다.

ReplicationNumSyncingIndices

복제 상태가 SYNCING인 인덱스의 수입니다.

ReplicationNumBootstrappingIndices

복제 상태가 BOOTSTRAPPING인 인덱스의 수입니다.

ReplicationNumPausedIndices

복제 상태가 PAUSED인 인덱스의 수입니다.

ReplicationNumFailedIndices

복제 상태가 FAILED인 인덱스의 수입니다.

CrossClusterOutboundReplicationRequests

팔로워 도메인의 복제 전송 요청 수입니다. 전송 요청은 내부적이며 복제 API 작업이 호출될 때마다 발생합니다. 팔로워 도메인 폴이 리더 도메인에서 변경될 때도 발생합니다.

CrossClusterInboundReplicationRequests

리더 도메인의 복제 전송 요청 수입니다. 전송 요청은 내부적이며 복제 API 작업이 호출될 때마다 발생합니다.

AutoFollowNumSuccessStartReplication

특정 연결에 대한 복제 규칙에 의해 성공적으로 생성된 팔로워 인덱스의 수입니다.

AutoFollowNumFailedStartReplication

일치하는 패턴이 있을 때 복제 규칙에 의해 생성되지 못한 팔로워 인덱스의 수입니다. 이 문제는 원격 클러스터의 네트워크 문제 또는 보안 문제(즉, 연결된 역할에 복제를 시작할 권한이 없음)로 인해 발생할 수 있습니다.

AutoFollowLeaderCallFailure

새 데이터를 가져오기 위해 팔로워 인덱스에서 리더 인덱스로의 쿼리가 실패했는지 여부입니다. 값 1은 최근 1분 동안 1회 이상의 실패한 호출이 있음을 의미합니다.

순위 학습 지표

Amazon OpenSearch Service는 랭킹 학습에 대해 다음과 같은 지표를 제공합니다.

지표 설명
LTRRequestTotalCount

순위 요청의 총 수입니다.

LTRRequestErrorCount

실패한 요청의 총 수입니다.

LTRStatus.red

플러그 인을 실행하는 데 필요한 인덱스 중 하나가 빨간색인지 추적합니다.

LTRMemoryUsage

플러그인이 사용하는 총 메모리입니다.

LTRFeatureMemoryUsageInBytes

순위 학습 기능 필드에서 사용되는 메모리의 양(바이트)입니다.

LTRFeaturesetMemoryUsageInBytes

모든 순위 학습 기능 집합에서 사용되는 메모리의 양(바이트)입니다.

LTRModelMemoryUsageInBytes

모든 순위 학습 모델에서 사용되는 메모리의 양(바이트)입니다.

파이프 처리 언어 지표

Amazon OpenSearch Service는 파이프 프로세싱 언어에 대해 다음과 같은 지표를 제공합니다.

지표 설명
PPLFailedRequestCountByCusErr

클라이언트 문제로 인해 _ppl API 실패한 요청의 수입니다. 예를 들어 요청으로 인해 HTTP 상태 코드 400이 반환될 수 IndexNotFoundException 있습니다.

PPLFailedRequestCountBySysErr

서버 문제 또는 기능 제한으로 인해 실패한 요청의 수입니다. _ppl API 예를 들어 a로 인해 요청에서 HTTP 상태 코드 503이 반환될 수 있습니다VerificationException.

PPLRequestCount

에 대한 요청 수입니다. _ppl API