기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon을 통한 OpenSearch 클러스터 지표 모니터링 CloudWatch
Amazon OpenSearch 서비스는 도메인의 데이터를 CloudWatch Amazon에 게시합니다. CloudWatch 이러한 데이터 포인트에 대한 통계를 지표라고 하는 정렬된 시계열 데이터 세트로 검색할 수 있습니다. OpenSearch 서비스는 대부분의 메트릭을 60초 CloudWatch 간격으로 전송합니다. 범용 또는 마그네틱 EBS 볼륨을 사용하는 경우 EBS 볼륨 지표는 5분마다 업데이트됩니다. 모든 누적 지표 (예: ThreadpoolWriteRejected
ThreadpoolSearchRejected
) 는 메모리에 있으며 상태가 손실됩니다. 지표는 노드 삭제, 노드 바운스, 노드 교체 및 블루/그린 배포 중에 재설정됩니다. CloudWatchAmazon에 대한 자세한 내용은 Amazon CloudWatch 사용 설명서를 참조하십시오.
OpenSearch 서비스 콘솔에는 의 원시 데이터를 기반으로 한 일련의 차트가 표시됩니다 CloudWatch. 필요에 따라 콘솔에서 그래프 CloudWatch 대신 클러스터 데이터를 보는 것을 선호할 수도 있습니다. 지표는 2주 동안 보관된 후 삭제됩니다. 지표는 추가 비용 없이 제공되지만 대시보드 및 경보 생성 비용은 CloudWatch 여전히 부과됩니다. 자세한 내용은 Amazon CloudWatch 요금을
OpenSearch 서비스는 다음과 같은 지표를 게시합니다. CloudWatch
에서 지표 보기 CloudWatch
CloudWatch 지표는 먼저 서비스 네임스페이스별로 그룹화된 다음 각 네임스페이스 내의 다양한 차원 조합별로 그룹화됩니다.
콘솔을 사용하여 메트릭을 보려면 CloudWatch
-
에서 CloudWatch 콘솔을 엽니다 https://console.aws.amazon.com/cloudwatch/
. -
왼쪽 탐색 창에서 Metrics(지표)를 찾은 다음 All metrics(모든 지표)를 선택합니다. ES/ OpenSearchService 네임스페이스를 선택합니다.
-
해당 지표를 보려면 차원을 선택합니다. 개별 노드에 대한 지표는
ClientId, DomainName, NodeId
차원에 있습니다. 클러스터 지표는Per-Domain, Per-Client Metrics
차원에 있습니다. 일부 노드 지표는 클러스터 수준에서 집계되므로 두 차원 모두에 포함됩니다. 샤드 지표는ClientId, DomainName, NodeId, ShardRole
차원에 있습니다.
를 사용하여 메트릭 목록을 보려면 AWS CLI
다음 명령 실행:
aws cloudwatch list-metrics --namespace "AWS/ES"
서비스의 상태 차트 해석 OpenSearch
OpenSearch 서비스에서 지표를 보려면 클러스터 상태 및 인스턴스 상태 탭을 사용하십시오. Instance Health 탭에서는 상자 차트를 사용하여 각 OpenSearch 노드의 상태를 at-a-glance 파악할 수 있습니다.
-
각 색 상자는 지정된 기간에 노드의 값 범위를 보여줍니다.
-
파란색 상자는 다른 노드와 일관적인 값을 나타냅니다. 빨간색 상자는 이상값을 나타냅니다
-
각 상자 내의 흰색 선은 노드의 현재 값을 보여줍니다.
-
각 상자의 양쪽에 있는 “수염”은 일정 기간에 모든 노드의 최솟값과 최댓값을 보여줍니다.
도메인의 구성을 변경하는 경우 Cluster health(클러스터 상태) 및 Instance health(인스턴스 상태) 탭의 개별 인스턴스 목록이 정확한 수로 반환되기 전에 짧은 기간에 두 배의 크기로 증가하곤 합니다. 이 동작에 대한 설명은 Amazon OpenSearch 서비스에서 구성 변경 섹션을 참조하세요.
클러스터 지표
Amazon OpenSearch Service는 클러스터에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
ClusterStatus.green |
값이 1이면 클러스터의 노드에 모든 인덱스 샤드가 할당되었음을 나타냅니다. 관련 통계: Maximum |
ClusterStatus.yellow |
값이 1이면 모든 인덱스의 기본 샤드가 클러스터의 노드에 할당되어 있지만 하나 이상의 인덱스에 대해 복제본 샤드가 할당되어 있지 않음을 나타냅니다. 자세한 내용은 노란색 클러스터 상태 단원을 참조하십시오. 관련 통계: Maximum |
ClusterStatus.red |
값이 1이면 인덱스 하나 이상의 기본 및 복제본 샤드가 클러스터의 노드에 할당되지 않았음을 나타냅니다. 자세한 내용은 빨간색 클러스터 상태 섹션을 참조하세요. 관련 통계: Maximum |
Shards.active |
활성 기본 및 복제본 샤드의 총 수입니다. 관련 통계: Maximum, Sum |
Shards.unassigned |
클러스터의 노드에 할당되지 않은 샤드 수입니다. 관련 통계: Maximum, Sum |
Shards.delayedUnassigned |
제한 시간 설정으로 노드 할당이 지연된 샤드 수입니다. 관련 통계: Maximum, Sum |
Shards.activePrimary |
활성 기본 샤드 수입니다. 관련 통계: Maximum, Sum |
Shards.initializing |
초기화 중인 샤드 수입니다. 관련 통계: 합계 |
Shards.relocating |
재배치 중인 샤드 수입니다. 관련 통계: 합계 |
Nodes |
전용 마스터 노드 및 노드를 포함한 OpenSearch 서비스 클러스터의 UltraWarm 노드 수 자세한 내용은 Amazon OpenSearch 서비스에서 구성 변경 단원을 참조하십시오. 관련 통계: Maximum |
SearchableDocuments |
클러스터의 모든 데이터 노드에서 검색 가능한 총 문서 수입니다. 관련 통계: 최소, 최대, 평균 |
DeletedDocuments |
클러스터의 모든 데이터 노드에서 삭제 표시된 총 문서 수입니다. 이러한 문서는 더 이상 검색 결과에 표시되지 않고 세그먼트 병합 중에 디스크에서 삭제된 OpenSearch 문서만 제거합니다. 이 지표는 삭제 요청 후 증가하고 세그먼트 병합 후 감소합니다. 관련 통계: 최소, 최대, 평균 |
CPUUtilization |
클러스터의 데이터 노드 CPU 사용률. 최대값은 CPU 사용량이 가장 많은 노드를 나타냅니다. 평균은 클러스터의 모든 노드를 나타냅니다. 이 지표는 개별 노드에도 사용할 수 있습니다. 관련 통계: Maximum, Average |
FreeStorageSpace |
클러스터에서 사용할 수 있는 데이터 노드 공간입니다. OpenSearch 서비스 콘솔은 이 값을 GiB 단위로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다. 참고
관련 통계: Minimum, Maximum, Average, Sum |
ClusterUsedSpace |
클러스터의 총 사용 공간입니다. 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다. OpenSearch 서비스 콘솔은 이 값을 GiB 단위로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다. 관련 통계: Minimum, Maximum |
ClusterIndexWritesBlocked |
수신되는 쓰기 요청에 대한 클러스터의 허용 또는 차단 여부를 나타냅니다. 값이 0이면 클러스터가 요청을 허용하고 있다는 것을 의미합니다. 값이 1이면 클러스터가 요청을 차단하고 있다는 것을 의미합니다. 몇 가지 공통적인 요인을 꼽자면 관련 통계: Maximum |
JVMMemoryPressure |
클러스터의 모든 데이터 노드에 사용된 Java 힙의 최대 비율입니다. OpenSearch 서비스는 인스턴스의 절반을 Java RAM 힙에 사용하며, 힙 크기는 최대 32GiB입니다. 인스턴스를 수직으로 최대 RAM 64GiB까지 확장할 수 있으며, 이때 인스턴스를 추가하여 수평으로 확장할 수 있습니다. 아마존 OpenSearch 서비스를 위한 권장 CloudWatch 알람을 참조하세요. 관련 통계: Maximum 참고서비스 소프트웨어 R20220323에서 이 지표에 대한 로직이 변경되었습니다. 자세한 내용은 릴리스 정보를 참조하세요. |
OldGenJVMMemoryPressure |
클러스터의 모든 데이터 노드에서 '구세대'에 사용된 Java 힙의 최대 비율입니다. 이 지표는 노드 수준에도 사용할 수 있습니다. 관련 통계: Maximum |
AutomatedSnapshotFailure |
클러스터에 대해 실패한 자동 스냅샷 수입니다. 값 관련 통계: Minimum, Maximum |
CPUCreditBalance |
클러스터의 데이터 노드에 사용할 수 있는 나머지 CPU 크레딧입니다. CPU크레딧은 1분 동안 풀 CPU 코어의 성능을 제공합니다. 자세한 내용은 Amazon EC2 개발자 안내서의 CPU 크레딧을 참조하십시오. 이 지표는 T2 인스턴스 유형에 대해서만 확인할 수 있습니다. 관련 통계: Minimum |
OpenSearchDashboardsHealthyNodes |
OpenSearch 대시보드 상태 점검. 최솟값, 최댓값 및 평균이 모두 1과 같으면 Dashboards가 정상적으로 동작하고 있습니다. 최대 1, 최소 0, 평균 0.7인 노드가 10개 있는 경우 이는 노드 7개(70%)가 정상이고 노드 3개(30%)가 비정상임을 의미합니다. 관련 통계: 최소, 최대, 평균 |
OpensearchDashboardsReportingFailedRequestSysErrCount |
서버 문제 또는 기능 제한으로 인해 실패한 OpenSearch 대시보드 보고서 생성 요청 수입니다. 관련 통계: 합계 |
OpensearchDashboardsReportingFailedRequestUserErrCount |
클라이언트 문제로 인해 실패한 OpenSearch 대시보드 보고서 생성 요청 수 관련 통계: 합계 |
OpensearchDashboardsReportingRequestCount |
OpenSearch 대시보드 보고서를 생성하기 위한 총 요청 수입니다. 관련 통계: 합계 |
OpensearchDashboardsReportingSuccessCount |
OpenSearch 대시보드 보고서 생성을 성공적으로 요청한 횟수. 관련 통계: 합계 |
KMSKeyError |
값이 1이면 다음을 나타냅니다. AWS KMS 저장된 데이터를 암호화하는 데 사용되는 키가 비활성화되었습니다. 도메인을 정상 작동으로 복원하려면 키를 다시 활성화해야 합니다. 콘솔에는 저장된 데이터를 암호화하는 도메인에 대해서만 이 지표가 표시됩니다. 관련 통계: Minimum, Maximum |
KMSKeyInaccessible |
값이 1이면 다음을 나타냅니다. AWS KMS 저장된 데이터를 암호화하는 데 사용된 키가 삭제되었거나 서비스에 대한 부여가 취소되었습니다. OpenSearch 이 상태의 도메인은 복원할 수 없습니다. 하지만 수동 스냅샷이 있는 경우 해당 스냅샷을 사용하여 도메인의 데이터를 새 도메인으로 마이그레이션할 수 있습니다. 콘솔에는 저장된 데이터를 암호화하는 도메인에 대해서만 이 지표가 표시됩니다. 관련 통계: Minimum, Maximum |
InvalidHostHeaderRequests |
유효하지 않은 (또는 누락된) OpenSearch 호스트 헤더가 포함된 클러스터에 대한 HTTP 요청 수입니다. 유효한 요청에는 호스트 헤더 값으로 도메인 호스트 이름이 포함됩니다. OpenSearch 서비스는 제한적인 액세스 정책이 없는 퍼블릭 액세스 도메인에 대한 잘못된 요청을 거부합니다. 모든 도메인에 제한적인 액세스 정책을 적용하는 것을 권장합니다. 이 지표의 값이 큰 경우 OpenSearch 클라이언트가 요청에 도메인 호스트 이름 (예: IP 주소 제외) 을 포함하는지 확인하십시오. 관련 통계: 합계 |
OpenSearchRequests (previously
ElasticsearchRequests) |
OpenSearch 클러스터에 대한 요청 수. 관련 통계: 합계 |
2xx, 3xx, 4xx, 5xx |
도메인에 대한 요청 중 주어진 HTTP 응답 코드 (2 xx, 3 xx, 4 xx, 5 xx) 가 발생한 요청 수입니다. 관련 통계: 합계 |
ThroughputThrottle |
디스크가 제한되었는지 여부를 나타냅니다. 제한은 인스턴스 처리량에 대한 자세한 내용은 Amazon EBS 최적화 인스턴스를 참조하십시오. 볼륨 처리량에 대한 자세한 내용은 Amazon EBS 볼륨 유형을 관련 통계: Minimum, Maximum |
IopsThrottle |
도메인의 초당 입력/출력 작업 수 (IOPS) 가 제한되었는지 여부를 나타냅니다. 데이터 노드가 EBS 볼륨 또는 데이터 노드 IOPS 인스턴스의 최대 허용 한도를 위반하면 전송률 조절이 발생합니다. EC2 인스턴스에 대한 자세한 IOPS 내용은 Amazon EBS 최적화 인스턴스를 참조하십시오. 볼륨에 대한 자세한 IOPS 내용은 Amazon EBS 볼륨 유형을 관련 통계: Minimum, Maximum |
HighSwapUsage |
값이 1이면 페이지 오류로 인한 스와핑으로 인해 특정 기간 동안 기본 디스크 사용량이 급증했을 수 있습니다. 관련 통계: Maximum |
전용 프라이머리 노드 지표입니다.
Amazon OpenSearch Service는 전용 마스터 노드에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
MasterCPUUtilization |
전용 마스터 노드에서 사용하는 CPU 리소스의 최대 비율. 이 지표가 60%에 도달하면 인스턴스 유형의 크기를 늘리는 것이 좋습니다. 관련 통계: Maximum |
MasterFreeStorageSpace |
이 지표는 관련이 없으므로 무시해도 좋습니다. 이 서비스에서는 프라이머리 노드를 데이터 노드로 사용하지 않습니다. |
MasterJVMMemoryPressure |
클러스터의 모든 전용 프라이머리 노드에 사용되는 Java 힙의 최대 비율. 이 지표가 85%에 도달하면 더 큰 인스턴스 유형으로 이전하는 것이 좋습니다. 관련 통계: Maximum 참고서비스 소프트웨어 R20220323에서 이 지표에 대한 로직이 변경되었습니다. 자세한 내용은 릴리스 정보를 참조하세요. |
MasterOldGenJVMMemoryPressure |
프라이머리 노드당 '구세대'에 사용된 Java 힙의 최대 비율입니다. 관련 통계: Maximum |
MasterCPUCreditBalance |
클러스터의 전용 마스터 노드에 사용할 수 있는 나머지 CPU 크레딧입니다. CPU크레딧은 1분 동안 풀 CPU 코어의 성능을 제공합니다. 자세한 내용은 Amazon EC2 개발자 안내서의 CPU 크레딧을 참조하십시오. 이 지표는 T2 인스턴스 유형에 대해서만 확인할 수 있습니다. 관련 통계: Minimum |
MasterReachableFromNode |
여기에서 오류란 소스 노드에서 프라이머리 노드에 도달할 수 없다는 것을 의미합니다. 일반적으로 네트워크 연결 문제 또는 보안 문제로 인해 발생합니다. AWS 종속성 문제. 관련 통계: Maximum |
MasterSysMemoryUtilization |
사용 중인 프라이머리 노드 메모리의 비율입니다. 관련 통계: Maximum |
EBS볼륨 메트릭
Amazon OpenSearch Service는 EBS 볼륨에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
ReadLatency |
EBS볼륨 읽기 작업의 지연 시간 (초). 이 지표는 개별 노드에도 사용할 수 있습니다. 관련 통계: 최소, 최대, 평균 |
WriteLatency |
EBS볼륨에 대한 쓰기 작업의 지연 시간 (초). 이 지표는 개별 노드에도 사용할 수 있습니다. 관련 통계: 최소, 최대, 평균 |
ReadThroughput |
EBS볼륨에 대한 읽기 작업의 처리량 (초당 바이트 수) 이 지표는 개별 노드에도 사용할 수 있습니다. 관련 통계: 최소, 최대, 평균 |
ReadThroughputMicroBursting |
마이크로 버스팅을 관련 통계: 최소, 최대, 평균 |
WriteThroughput |
볼륨에 대한 쓰기 작업의 처리량 (초당 바이트 수) EBS 이 지표는 개별 노드에도 사용할 수 있습니다. 관련 통계: 최소, 최대, 평균 |
WriteThroughputMicroBursting |
마이크로 버스팅을 관련 통계: 최소, 최대, 평균 |
DiskQueueDepth |
볼륨에 대해 보류 중인 입출력 (I/O) 요청 수입니다. EBS 관련 통계: 최소, 최대, 평균 |
ReadIOPS |
EBS볼륨에 대한 읽기 작업의 초당 입력 및 출력 (I/O) 작업 수입니다. 이 지표는 개별 노드에도 사용할 수 있습니다. 관련 통계: 최소, 최대, 평균 |
ReadIOPSMicroBursting |
마이크로 버스팅을 관련 통계: 최소, 최대, 평균 |
WriteIOPS |
볼륨에 대한 쓰기 작업의 초당 입력 및 출력 (I/O) 작업 수입니다. EBS 이 지표는 개별 노드에도 사용할 수 있습니다. 관련 통계: 최소, 최대, 평균 |
WriteIOPSMicroBursting |
마이크로 버스팅을 관련 통계: 최소, 최대, 평균 |
BurstBalance |
볼륨의 버스트 버킷에 남아 있는 입력 및 출력 (I/O) 크레딧의 비율입니다. EBS 값이 100이면 볼륨에 최대 크레딧 수가 누적되었음을 의미합니다. 이 비율이 70% 미만으로 떨어지면 낮은 EBS 버스트 밸런스 섹션을 참조하세요. gp3 볼륨 유형이 있는 도메인과 볼륨 크기가 1000GiB를 초과하는 gp2 볼륨이 있는 도메인의 경우 버스트 균형은 0으로 유지됩니다. 관련 통계: 최소, 최대, 평균 |
인스턴스 지표
Amazon OpenSearch Service는 도메인의 각 인스턴스에 대해 다음과 같은 지표를 제공합니다. OpenSearch 또한 서비스는 이러한 인스턴스 지표를 집계하여 전체 클러스터 상태에 대한 통찰력을 제공합니다. 콘솔에서 Sample Count(샘플 수) 통계를 이용하여 이 동작을 확인할 수 있습니다. 다음 표의 각 지표는 노드 및 클러스터 관련 통계를 포함합니다.
중요
Elasticsearch 버전마다 다른 스레드 풀을 사용하여 에 대한 호출을 처리합니다. _index
API Elasticsearch 1.5 및 2.3은 인덱스 스레드 풀을 사용합니다. 엘라스틱서치 5. x, 6.0, 6.2는 벌크 스레드 풀을 사용합니다. OpenSearch 그리고 Elasticsearch 6.3 이상에서는 쓰기 스레드 풀을 사용합니다. 현재 OpenSearch 서비스 콘솔에는 벌크 스레드 풀에 대한 그래프가 포함되어 있지 않습니다.
GET _cluster/settings?include_defaults=true
를 사용하여 클러스터의 스레드 풀과 대기열 크기를 확인합니다.
지표 | 설명 |
---|---|
ConcurrentSearchRate |
데이터 노드의 모든 샤드에 대해 분당 동시 세그먼트 검색을 사용한 검색 요청의 총 수입니다. 를 한 번 호출해도 여러 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum, Sum |
ConcurrentSearchLatency |
분 N에서 분 사이 (N-1) 사이의 노드에서 동시 세그먼트 검색을 사용하여 모든 검색에 소요된 총 시간 차이 (밀리초) 입니다. 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum |
IndexingLatency |
한 노드의 모든 인덱싱 작업에 소요된 총 시간 차이(밀리초)로, 이 차이는 분 N에서 (N-1)분입니다. 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum |
IndexingRate |
분당 인덱싱 작업 수입니다. 를 한 번 호출하면 문서 두 개가 추가되고 두 개가 네 번의 작업으로 계산되어 하나 이상의 노드에 분산될 수 있습니다. 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum, Sum |
SearchLatency |
한 노드의 모든 검색 작업에 소요된 총 시간 차이(밀리초)로, 이 차이는 분 N에서 (N-1)분입니다. 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum |
SearchRate |
한 데이터 노드의 모든 샤드에 대한 분당 검색 요청의 총 수입니다. 를 한 번 호출해도 여러 샤드의 결과가 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum, Sum |
SegmentCount |
데이터 노드의 세그먼트 수입니다. 세그먼트가 많을수록 각 검색에 소요되는 시간이 길어집니다. OpenSearch 작은 세그먼트를 큰 세그먼트로 병합하는 경우가 있습니다. 관련 노드 통계: Maximum, Average 관련 클러스터 통계: Sum, Maximum, Average |
SysMemoryUtilization |
사용 중인 인스턴스 메모리의 비율(%)입니다. 이 지표의 값이 큰 것은 정상이며 일반적으로 클러스터에 문제가 있음을 나타내지 않습니다. 잠재적인 성능 및 안정성 문제에 대한 더 나은 지표는 관련 노드 통계: Minimum, Maximum, Average 관련 클러스터 통계: Minimum, Maximum, Average |
JVMGCYoungCollectionCount |
"신세대" 가비지 수집이 실행된 횟수입니다. 클러스터 작업은 일반적으로 실행 수가 계속 증가하여 커집니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
JVMGCYoungCollectionTime |
클러스터가 "신세대" 가비지 수집을 수행하는 데 소비 한 시간(밀리초)입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
JVMGCOldCollectionCount |
"구세대" 가비지 수집이 실행된 횟수입니다. 리소스가 충분한 클러스터에서는 이 수가 적게 유지되고 자주 증가하지 않습니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
JVMGCOldCollectionTime |
클러스터가 "구세대" 가비지 수집을 수행하는 데 소비 한 시간 (밀리초)입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
OpenSearchDashboardsConcurrentConnections |
대시보드에 대한 활성 동시 연결 수 OpenSearch 이 수가 계속 증가하면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
OpenSearchDashboardsHealthyNode |
개별 OpenSearch 대시보드 노드의 상태 점검. 값이 1이면 정상적인 동작 상태를 나타냅니다. 값이 0이면 Dashboards에 액세스할 수 없다는 것을 나타냅니다. 관련 노드 통계: Minimum 관련 클러스터 통계: Minimum, Maximum, Average |
OpenSearchDashboardsHeapTotal |
OpenSearch 대시보드에 할당된 힙 메모리의 양 (MiB) 다양한 EC2 인스턴스 유형이 정확한 메모리 할당에 영향을 미칠 수 있습니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
OpenSearchDashboardsHeapUsed |
OpenSearch 대시보드에서 사용하는 힙 메모리의 절대량 (MiB) 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
OpenSearchDashboardsHeapUtilization |
대시보드에서 사용하는 사용 가능한 힙 메모리의 최대 비율입니다. OpenSearch 이 값이 80% 이상으로 증가하면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Minimum, Maximum, Average |
OpenSearchDashboardsOS1MinuteLoad |
대시보드의 평균 CPU 로드 시간은 1분입니다. OpenSearch CPU부하가 1.00 미만으로 유지되는 것이 이상적입니다. 일시적인 급증은 정상이지만 이 지표가 지속해서 1.00을 초과할 경우 인스턴스 유형의 크기를 늘리는 것이 좋습니다. 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum |
OpenSearchDashboardsRequestTotal |
OpenSearch 대시보드에 대한 총 HTTP 요청 수입니다. 시스템 속도가 느리거나 Dashboards 요청 수가 많으면 인스턴스 유형의 크기를 늘리는 것을 고려합니다. 관련 노드 통계: Sum 관련 클러스터 통계: Sum |
OpenSearchDashboardsResponseTimesMaxInMillis |
OpenSearch 대시보드가 요청에 응답하는 데 걸리는 최대 시간 (밀리초) 요청 결과가 반환되는 데 시간이 지속해서 오래 걸리는 경우 인스턴스 유형의 크기를 늘리는 것을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Maximum, Average |
SearchTaskCancelled |
코디네이터 노드 취소 횟수. 관련 노드 통계: Sum 관련 클러스터 통계: Sum |
SearchShardTaskCancelled |
데이터 노드 취소 횟수. 관련 노드 통계: Sum 관련 클러스터 통계: Sum, |
ThreadpoolForce_mergeQueue |
강제 병합 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
ThreadpoolForce_mergeRejected |
강제 병합 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum |
ThreadpoolForce_mergeThreads |
강제 병합 스레드 풀의 크기입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
ThreadpoolIndexQueue |
인덱스 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 인덱스 대기열의 최대 크기는 200입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
ThreadpoolIndexRejected |
인덱스 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum |
ThreadpoolIndexThreads |
인덱스 스레드 풀의 크기입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
ThreadpoolSearchQueue |
검색 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 검색 대기열의 최대 크기는 1,000입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
ThreadpoolSearchRejected |
검색 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum |
ThreadpoolSearchThreads |
검색 스레드 풀의 크기입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
Threadpoolsql-workerQueue |
검색 스레드 풀에서 대기열에 있는 작업의 SQL 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
Threadpoolsql-workerRejected |
SQL검색 스레드 풀에서 거부된 작업 수 이 수가 계속 증가하면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum |
Threadpoolsql-workerThreads |
SQL검색 스레드 풀의 크기. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
ThreadpoolBulkQueue |
벌크 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
ThreadpoolBulkRejected |
벌크 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum |
ThreadpoolBulkThreads |
벌크 스레드 풀의 크기입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
ThreadpoolIndexSearcherQueue |
인덱스 검색기 스레드 풀에서 대기열에 있는 작업의 수입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
ThreadpoolIndexSearcherRejected |
색인 검색기 스레드 풀에서 거부된 작업 수입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum |
ThreadpoolIndexSearcherThreads |
색인 검색기 스레드 풀의 크기. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
ThreadpoolWriteThreads |
쓰기 스레드 풀의 크기입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
ThreadpoolWriteQueue |
쓰기 스레드 풀에서 대기 중인 작업의 수입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
ThreadpoolWriteRejected |
쓰기 스레드 풀에서 거부된 작업의 수입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum 참고버전 7.1에서 기본 쓰기 대기열 크기가 200에서 10000으로 증가했기 때문에 이 지표는 더 이상 Service의 거부를 나타내는 유일한 지표가 아닙니다. OpenSearch |
CoordinatingWriteRejected |
마지막 서비스 프로세스 시작 이후 인덱싱 압박으로 인해 조정 노드에서 발생한 총 거부 수입니다. OpenSearch 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum 이 지표는 버전 7.1 및 이후 버전에서 사용할 수 있습니다. |
PrimaryWriteRejected |
마지막 서비스 프로세스 시작 이후 인덱싱 압력으로 인해 기본 샤드에서 발생한 총 거부 건수입니다. OpenSearch 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum 이 지표는 버전 7.1 및 이후 버전에서 사용할 수 있습니다. |
ReplicaWriteRejected |
마지막 서비스 프로세스 시작 이후 인덱싱 압박으로 인해 복제본 샤드에서 발생한 총 거부 건수입니다. OpenSearch 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum 이 지표는 버전 7.1 및 이후 버전에서 사용할 수 있습니다. |
UltraWarm 메트릭
Amazon OpenSearch Service는 UltraWarm노드에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
WarmCPUUtilization |
클러스터 내 UltraWarm 노드 CPU 사용률. 최대값은 CPU 사용량이 가장 많은 노드를 나타냅니다. 평균은 클러스터의 모든 UltraWarm 노드를 나타냅니다. 이 지표는 개별 UltraWarm 노드에도 사용할 수 있습니다. 관련 통계: Maximum, Average |
WarmFreeStorageSpace |
사용 가능한 웜 스토리지 공간(MiB)입니다. 연결된 디스크가 아닌 Amazon S3를 UltraWarm 사용하는 관련 통계: 합계 |
WarmSearchableDocuments |
클러스터의 모든 웜 인덱스에서 검색 가능한 총 문서 수입니다. 정확한 값을 얻으려면 이 기간을 1분으로 두어야 합니다. 관련 통계: 합계 |
WarmSearchLatency
|
분 N에서 분 (N-1) UltraWarm 사이의 모든 검색에 소요된 총 시간 차이 (밀리초). 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum |
WarmSearchRate
|
노드에 있는 모든 샤드에 대한 분당 총 검색 요청 수입니다. UltraWarm 를 한 번 호출하면 여러 샤드의 결과가 관련 노드 통계: Average 관련 클러스터 통계: Average, Maximum, Sum |
WarmStorageSpaceUtilization |
클러스터가 사용 중인 총 웜 스토리지 공간 크기(MiB)입니다. 관련 통계: Maximum |
HotStorageSpaceUtilization
|
클러스터를 사용 중인 총 핫 스토리지 공간 크기입니다. 관련 통계: Maximum |
WarmSysMemoryUtilization |
사용 중인 웜 노드 메모리의 비율입니다. 관련 통계: Maximum |
HotToWarmMigrationQueueSize
|
현재 핫 스토리지에서 웜 스토리지로의 마이그레이션을 기다리는 인덱스 수입니다. 관련 통계: Maximum |
WarmToHotMigrationQueueSize
|
현재 웜 스토리지에서 핫 스토리지로의 마이그레이션을 기다리는 인덱스 수입니다. 관련 통계: Maximum |
HotToWarmMigrationFailureCount
|
실패한 핫-웜 마이그레이션의 총 수입니다. 관련 통계: 합계 |
HotToWarmMigrationForceMergeLatency
|
마이그레이션 프로세스의 강제 병합 단계의 평균 대기 시간입니다. 이 단계가 일관되게 너무 오래 걸리면 관련 통계: Average |
HotToWarmMigrationSnapshotLatency
|
마이그레이션 프로세스 중 스냅샷 단계의 평균 대기 시간입니다. 이 단계가 일관되게 너무 오래 걸리면 샤드의 크기가 적절하게 조정되고 클러스터 전체에 분산되어 있는지 확인합니다. 관련 통계: Average |
HotToWarmMigrationProcessingLatency
|
성공한 핫-웜 마이그레이션의 평균 대기 시간으로, 대기열에서 소요된 시간을 포함하지 않습니다. 이 값은 마이그레이션 프로세스의 강제 병합, 스냅샷 및 샤드 재배치 단계를 완료하는 데 걸리는 시간의 합계입니다. 관련 통계: Average |
HotToWarmMigrationSuccessCount
|
성공한 핫-웜 마이그레이션의 총 수입니다. 관련 통계: 합계 |
HotToWarmMigrationSuccessLatency
|
성공한 핫-웜 마이그레이션의 평균 대기 시간으로, 대기열에서 소요된 시간을 포함합니다. 관련 통계: Average |
WarmThreadpoolSearchThreads |
UltraWarm 검색 스레드 풀의 크기. 관련 노드 통계: Maximum 관련 클러스터 통계: Average, Sum |
WarmThreadpoolSearchRejected |
UltraWarm 검색 스레드 풀에서 거부된 작업 수 이 수가 계속 늘어난다면 UltraWarm 노드를 더 추가해 보세요. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum |
WarmThreadpoolSearchQueue |
UltraWarm 검색 스레드 풀의 대기열에 있는 작업 수 대기열 크기가 계속 크면 노드를 더 UltraWarm 추가하는 것을 고려해 보세요. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
WarmJVMMemoryPressure |
UltraWarm노드에 사용된 Java 힙의 최대 비율입니다. 관련 통계: Maximum 참고서비스 소프트웨어 R20220323에서 이 지표에 대한 로직이 변경되었습니다. 자세한 내용은 릴리스 정보를 참조하세요. |
WarmOldGenJVMMemoryPressure |
노드당 UltraWarm “이전 세대”에 사용된 Java 힙의 최대 비율입니다. 관련 통계: Maximum |
WarmJVMGCYoungCollectionCount |
“젊은 세대”의 가비지 컬렉션이 UltraWarm 노드에서 실행된 횟수입니다. 클러스터 작업은 일반적으로 실행 수가 계속 증가하여 커집니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
WarmJVMGCYoungCollectionTime |
클러스터가 UltraWarm 노드에서 “젊은 세대” 가비지 컬렉션을 수행하는 데 소요한 시간 (밀리초) 입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
WarmJVMGCOldCollectionCount |
“이전 세대” 가비지 컬렉션이 UltraWarm 노드에서 실행된 횟수입니다. 리소스가 충분한 클러스터에서는 이 수가 적게 유지되고 자주 증가하지 않습니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
WarmConcurrentSearchRate |
노드에 있는 모든 샤드에 대해 분당 동시 세그먼트 검색을 사용한 총 검색 요청 수입니다. UltraWarm 를 한 번 호출하면 다양한 관련 노드 통계: Average 관련 클러스터 통계: Sum, Maximum, Average |
WarmConcurrentSearchLatency |
분 N에서 분 사이 (N-1) 사이의 UltraWarm 노드에서 동시 세그먼트 검색을 사용하여 모든 검색에 소요된 총 시간 차이 (밀리초) 입니다. 관련 노드 통계: Average 관련 클러스터 통계: Maximum, Average |
WarmThreadpoolIndexSearcherQueue |
색인 검색기 스레드 풀에서 대기열에 있는 작업의 UltraWarm 수입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum, Maximum, Average |
WarmThreadpoolIndexSearcherRejected |
UltraWarm 색인 검색기 스레드 풀에서 거부된 작업 수입니다. 관련 노드 통계: Maximum 관련 클러스터 통계: Sum |
WarmThreadpoolIndexSearcherThreads |
UltraWarm 색인 검색기 스레드 풀의 크기. 관련 노드 통계: Maximum 관련 클러스터 통계: 합계, 평균 |
콜드 스토리지 지표
Amazon OpenSearch Service는 콜드 스토리지에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
ColdStorageSpaceUtilization
|
클러스터를 사용 중인 총 콜드 스토리지 공간 크기(MiB)입니다. 관련 통계: 최대 |
ColdToWarmMigrationFailureCount |
실패한 콜드-웜 마이그레이션의 총 수입니다. 관련 통계: 합계 |
ColdToWarmMigrationLatency |
콜드-웜 마이그레이션을 성공적으로 완료하는 데 걸리는 시간입니다. 관련 통계: Average |
ColdToWarmMigrationQueueSize |
현재 콜드 스토리지에서 웜 스토리지로의 마이그레이션을 기다리는 인덱스 수입니다. 관련 통계: Maximum |
ColdToWarmMigrationSuccessCount
|
성공한 콜드-웜 마이그레이션의 총 수입니다. 관련 통계: 합계 |
WarmToColdMigrationFailureCount
|
실패한 웜-콜드 마이그레이션의 총 수입니다. 관련 통계: 합계 |
WarmToColdMigrationLatency |
웜-콜드 마이그레이션을 성공적으로 완료하는 데 걸리는 시간입니다. 관련 통계: Average |
WarmToColdMigrationQueueSize |
현재 웜 스토리지에서 콜드 스토리지로의 마이그레이션을 기다리는 인덱스 수입니다. 관련 통계: Maximum |
WarmToColdMigrationSuccessCount |
성공한 웜-콜드 마이그레이션의 총 수입니다. 관련 통계: 합계 |
OR1지표
Amazon OpenSearch 서비스는 OR1인스턴스에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
RemoteStorageUsedSpace
|
클러스터가 사용 중인 총 Amazon S3 공간 크기(MiB)입니다. 관련 통계: 합계 |
RemoteStorageWriteRejected |
원격 스토리지 및 복제 압력으로 인해 기본 샤드에서 거부된 총 요청 수입니다. 이는 마지막 OpenSearch 서비스 프로세스 시작부터 시작하여 계산됩니다. 관련 통계: 합계 |
ReplicationLagMaxTime |
복제본 샤드가 기본 샤드보다 뒤쳐지는 시간 (밀리초) 관련 통계: Maximum |
알림 지표
Amazon OpenSearch Service는 알림에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
AlertingDegraded |
값이 1이면 알림 인덱스가 빨간색이거나 하나 이상의 노드가 일정에 따라 실행되지 않음을 의미하고, 값이 0이면 정상적인 동작 상태를 나타냅니다. 관련 통계: Maximum |
AlertingIndexExists |
값이 1이면 관련 통계: Maximum |
AlertingIndexStatus.green |
인덱스의 상태입니다. 값이 1이면 녹색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 녹색이 아님을 의미합니다. 관련 통계: Maximum |
AlertingIndexStatus.red |
인덱스의 상태입니다. 값이 1이면 빨간색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 빨간색이 아님을 의미합니다. 관련 통계: Maximum |
AlertingIndexStatus.yellow |
인덱스의 상태입니다. 값이 1이면 노란색을 의미하고, 값이 0이면 인덱스가 존재하지 않거나 노란색이 아님을 의미합니다. 관련 통계: Maximum |
AlertingNodesNotOnSchedule |
값이 1이면 일부 작업이 일정에 따라 실행되고 있지 않음을 의미하고, 값이 0이면 모든 알림 작업이 일정에 따라 실행 중이거나 알림 작업이 없음을 의미합니다. OpenSearch 서비스 콘솔을 확인하거나 관련 통계: Maximum |
AlertingNodesOnSchedule |
값이 1이면 모든 알림 작업이 일정에 따라 실행 중이거나 알림 작업이 없음을 의미하고, 값이 0이면 일부 작업이 일정에 따라 실행되고 있지 않음을 의미합니다. 관련 통계: Maximum |
AlertingScheduledJobEnabled |
값이 1이면 관련 통계: Maximum |
이상 탐지 지표
Amazon OpenSearch Service는 예외 항목 탐지를 위해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
ADPluginUnhealthy |
값이 1이면 실패 횟수가 많거나 사용하는 인덱스 중 하나가 빨간색이기 때문에 이상 탐지 플러그 인이 제대로 작동하지 않음을 의미합니다. 값이 0이면 플러그인이 예상대로 작동하고 있음을 나타냅니다. 관련 통계: Maximum |
ADExecuteRequestCount |
이상을 탐지하기 위한 요청 수입니다. 관련 통계: 합계 |
ADExecuteFailureCount
|
이상을 탐지하기 위한 실패한 요청 수입니다. 관련 통계: 합계 |
ADHCExecuteFailureCount |
높은 카디널리티 탐지기를 위한 이상 탐지 요청 중 실패한 요청 수입니다. 관련 통계: 합계 |
ADHCExecuteRequestCount |
높은 카디널리티 탐지기를 위한 이상 탐지 요청 수입니다. 관련 통계: 합계 |
ADAnomalyResultsIndexStatusIndexExists |
값이 1이면 관련 통계: Maximum |
ADAnomalyResultsIndexStatus.red |
값이 1이면 관련 통계: Maximum |
ADAnomalyDetectorsIndexStatusIndexExists |
값이 1이면 관련 통계: Maximum |
ADAnomalyDetectorsIndexStatus.red |
값이 1이면 관련 통계: Maximum |
ADModelsCheckpointIndexStatusIndexExists |
값이 1이면 관련 통계: Maximum |
ADModelsCheckpointIndexStatus.red |
값이 1이면 관련 통계: Maximum |
비동기 검색 지표
Amazon OpenSearch Service는 비동기 검색에 대해 다음과 같은 지표를 제공합니다.
비동기 검색 코디네이터 노드 통계(코디네이터 노드당)
지표 | 설명 |
---|---|
AsynchronousSearchSubmissionRate |
지난 1분 동안 제출된 비동기 검색 수입니다. |
AsynchronousSearchInitializedRate |
지난 1분 동안 제출된 비동기 검색 수입니다. |
AsynchronousSearchRunningCurrent |
현재 실행 중인 비동기 검색 수입니다. |
AsynchronousSearchCompletionRate |
지난 1분 동안 성공적으로 완료한 비동기 검색 수입니다. |
AsynchronousSearchFailureRate |
지난 1분 동안 완료 및 실패한 비동기 검색 수입니다. |
AsynchronousSearchPersistRate |
지난 1분 동안 지속된 비동기 검색 수입니다. |
AsynchronousSearchPersistFailedRate |
지난 1분 동안 지속되지 못한 비동기 검색 수입니다. |
AsynchronousSearchRejected |
노드 작동 시간 이후 거부된 총 비동기 검색 수입니다. |
AsynchronousSearchCancelled |
노드 작동 시간 이후 취소된 총 비동기 검색 수입니다. |
AsynchronousSearchMaxRunningTime |
지난 1분 동안 노드에서 가장 오래 실행되는 비동기 검색의 지속 시간입니다. |
비동기 검색 클러스터 통계
지표 | 설명 |
---|---|
AsynchronousSearchStoreHealth |
최근 1분간의 지속형 인덱스 (RED/non-RED) 내 스토어 상태 |
AsynchronousSearchStoreSize |
지난 1분 동안 모든 샤드에 있는 시스템 인덱스의 크기입니다. |
AsynchronousSearchStoredResponseCount |
지난 1분 동안 시스템 인덱스에 저장된 응답 수입니다. |
지표 자동 조정
Amazon OpenSearch 서비스는 자동 조정에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
AutoTuneChangesHistoryHeapSize |
힙 크기 조정 값에 대한 MiB 변경 기록. |
AutoTuneChangesHistoryJVMYoungGenArgs |
JVM YongGen 인수에 대한 변경 기록. |
AutoTuneFailed |
자동 조정 변경에 실패했는지 여부를 나타내는 부울입니다. |
AutoTuneSucceeded |
자동 조정 변경에 성공했는지 여부를 나타내는 부울입니다. |
AutoTuneValue |
무중단 변경에 대한 대기열 변경 기록(개수) 및 캐시 조정 변경 기록(MiB 단위). |
Multi-AZ with Standby 지표
Amazon OpenSearch Service는 대기 모드가 있는 다중 AZ에 대해 다음과 같은 지표를 제공합니다.
활성 가용 영역의 데이터 노드에 대한 노드 수준 지표
지표 | 설명 |
---|---|
CPUUtilization |
클러스터의 데이터 노드 CPU 사용률. 최대값은 CPU 사용량이 가장 많은 노드를 나타냅니다. 평균은 클러스터의 모든 노드를 나타냅니다. 이 지표는 개별 노드에도 사용할 수 있습니다. |
FreeStorageSpace |
클러스터에서 사용할 수 있는 데이터 노드 공간입니다. OpenSearch 서비스 콘솔은 이 값을 GiB 단위로 표시합니다. Amazon CloudWatch 콘솔은 MiB로 표시합니다. |
JVMMemoryPressure |
클러스터의 모든 데이터 노드에 사용된 Java 힙의 최대 비율입니다. OpenSearch 서비스는 인스턴스의 절반을 Java RAM 힙에 사용하며, 힙 크기는 최대 32GiB입니다. 인스턴스를 수직으로 최대 RAM 64GiB까지 확장할 수 있으며, 이때 인스턴스를 추가하여 수평으로 확장할 수 있습니다. 아마존 OpenSearch 서비스를 위한 권장 CloudWatch 알람을 참조하세요. |
SysMemoryUtilization |
사용 중인 인스턴스 메모리의 비율(%)입니다. 이 지표의 값이 큰 것은 정상이며 일반적으로 클러스터에 문제가 있음을 나타내지 않습니다. 잠재적인 성능 및 안정성 문제에 대한 더 나은 지표는 JVMMemoryPressure 지표를 참조하세요. |
IndexingLatency |
한 노드의 모든 인덱싱 작업에 소요된 총 시간 차이(밀리초)로, 이 차이는 분 N에서 (N-1)분입니다. |
IndexingRate |
분당 인덱싱 작업 수입니다. |
SearchLatency |
한 노드의 모든 검색 작업에 소요된 총 시간 차이(밀리초)로, 이 차이는 분 N에서 (N-1)분입니다. |
SearchRate |
한 데이터 노드의 모든 샤드에 대한 분당 검색 요청의 총 수입니다. |
ThreadpoolSearchQueue |
검색 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속해서 높으면 클러스터 확장을 고려합니다. 검색 대기열의 최대 크기는 1,000입니다. |
ThreadpoolWriteQueue |
쓰기 스레드 풀에서 대기 중인 작업의 수입니다. |
ThreadpoolSearchRejected |
검색 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려합니다. |
ThreadpoolWriteRejected |
쓰기 스레드 풀에서 거부된 작업의 수입니다. |
활성 가용 영역의 클러스터에 대한 클러스터 수준 지표
지표 | 설명 |
---|---|
DataNodes |
활성 및 대기 샤드의 총 수입니다. |
DataNodesShards.active |
활성 기본 및 복제본 샤드의 총 수입니다. |
DataNodesShards.unassigned |
클러스터의 노드에 할당되지 않은 샤드 수입니다. |
DataNodesShards.initializing |
초기화 중인 샤드 수입니다. |
DataNodesShards.relocating |
재배치 중인 샤드 수입니다. |
가용 영역 회전 지표
ActiveReads.
인 경우 영역이 활성 상태입니다. Availability-Zone
= 1ActiveReads.
인 경우 영역이 대기 상태입니다.Availability-Zone
=
0
특정 시점 지표
Amazon OpenSearch Service는 특정 시점 (PIT) 검색에 대해 다음과 같은 지표를 제공합니다.
PIT코디네이터 노드 통계 (코디네이터 노드별)
지표 | 설명 |
---|---|
CurrentPointInTime |
노드의 활성 PIT 검색 컨텍스트 수 |
TotalPointInTime |
노드 가동 시간 이후 만료된 PIT 검색 컨텍스트 수입니다. |
AvgPointInTimeAliveTime |
노드 가동 시간 이후 PIT 검색 컨텍스트의 평균 유지 횟수입니다. |
HasActivePointInTime |
값이 1이면 노드 가동 시간 이후 노드에 활성 PIT 컨텍스트가 있음을 나타냅니다. 값이 0이면 없는 것입니다. |
HasUsedPointInTime |
값이 1이면 노드 가동 시간 이후 노드에 만료된 PIT 컨텍스트가 있음을 나타냅니다. 값이 0이면 없는 것입니다. |
SQL메트릭
Amazon OpenSearch 서비스는 SQL지원을 위해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
SQLFailedRequestCountByCusErr |
클라이언트 문제로 인해 관련 통계: 합계 |
SQLFailedRequestCountBySysErr |
서버 문제 또는 기능 제한으로 인해 실패한 요청의 수입니다. 관련 통계: 합계 |
SQLRequestCount |
에 대한 요청 수입니다. 관련 통계: 합계 |
SQLDefaultCursorRequestCount |
관련 통계: 합계 |
SQLUnhealthy |
값이 1이면 SQL 플러그인이 특정 요청에 대한 응답으로 5개의 xx 응답 코드를 반환하거나 잘못된 DSL 쿼리를 OpenSearch 전달하고 있음을 나타냅니다. 다른 요청은 계속 성공합니다. 값이 0이면 최근 실패가 없음을 나타냅니다. 지속해서 값이 1이면 클라이언트가 플러그인에 수행하는 요청 문제를 해결합니다. 관련 통계: Maximum |
k-NN 지표
Amazon OpenSearch Service에는 k-최근접이웃 (k-NN) 플러그인에 대한 다음 지표가 포함되어 있습니다.
지표 | 설명 |
---|---|
KNNCacheCapacityReached |
캐시 용량에 도달했는지에 대한 노드별 지표입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다. 관련 통계: Maximum |
KNNCircuitBreakerTriggered |
회로 차단기가 트리거되는지 여부에 대한 클러스터별 지표입니다. 어떤 노드가 관련 통계: Maximum |
KNNEvictionCount |
메모리 제약 조건 또는 유휴 시간으로 인해 캐시에서 제거된 그래프 수에 대한 노드별 지표입니다. 인덱스 삭제로 인해 발생하는 명시적 제거는 계산되지 않습니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다. 관련 통계: 합계 |
KNNGraphIndexErrors |
문서의 관련 통계: 합계 |
KNNGraphIndexRequests |
문서의 관련 통계: 합계 |
KNNGraphMemoryUsage |
현재 캐시 크기(메모리에 있는 모든 그래프의 총 크기)에 대한 노드별 지표입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다. 관련 통계: Average |
KNNGraphQueryErrors |
오류를 생성한 그래프 쿼리 수에 대한 노드별 지표입니다. 관련 통계: 합계 |
KNNGraphQueryRequests |
그래프 쿼리 수에 대한 노드별 지표입니다. 관련 통계: 합계 |
KNNHitCount |
캐시 적중 수에 대한 노드별 지표입니다. 캐시 적중은 사용자가 이미 메모리에 로드된 그래프를 쿼리할 때 발생합니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다. 관련 통계: 합계 |
KNNLoadExceptionCount |
그래프를 캐시로 로드하려고 시도하는 동안 예외가 발생한 횟수에 대한 노드별 지표입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다. 관련 통계: 합계 |
KNNLoadSuccessCount |
플러그인이 그래프를 캐시에 성공적으로 로드한 횟수에 대한 노드별 지표입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다. 관련 통계: 합계 |
KNNMissCount |
캐시 누락 수에 대한 노드별 지표입니다. 캐시 누락은 사용자가 아직 메모리에 로드되지 않은 그래프를 쿼리할 때 발생합니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다. 관련 통계: 합계 |
KNNQueryRequests |
k-NN 플러그인이 받은 쿼리 요청 수에 대한 노드별 지표입니다. 관련 통계: 합계 |
KNNScriptCompilationErrors |
스크립트 컴파일 중 오류 수에 대한 노드별 지표입니다. 이 통계는 k-NN 점수 스크립트 검색에만 관련이 있습니다. 관련 통계: 합계 |
KNNScriptCompilations |
k-NN 스크립트가 컴파일된 횟수에 대한 노드별 지표입니다. 이 값은 일반적으로 1 또는 0이어야 하지만 컴파일된 스크립트가 포함된 캐시가 채워지면 k-NN 스크립트가 다시 컴파일될 수 있습니다. 이 통계는 k-NN 점수 스크립트 검색에만 관련이 있습니다. 관련 통계: 합계 |
KNNScriptQueryErrors |
스크립트 쿼리 중 오류 수에 대한 노드별 지표입니다. 이 통계는 k-NN 점수 스크립트 검색에만 관련이 있습니다. 관련 통계: 합계 |
KNNScriptQueryRequests |
총 스크립트 쿼리 수에 대한 노드별 지표입니다. 이 통계는 k-NN 점수 스크립트 검색에만 관련이 있습니다. 관련 통계: 합계 |
KNNTotalLoadTime |
k-NN이 그래프를 캐시로 로드하는 데 소요된 시간(나노초)입니다. 이 지표는 대략적인 k-NN 검색에만 관련됩니다. 관련 통계: 합계 |
클러스터 간 검색 지표
Amazon OpenSearch Service는 클러스터 간 검색에 대해 다음과 같은 지표를 제공합니다.
소스 도메인 지표
지표 | 차원 | 설명 |
---|---|---|
CrossClusterOutboundConnections |
|
연결된 노드 수입니다. 응답에 하나 이상의 건너뛴 도메인이 포함된 경우 이 지표를 사용하여 비정상 연결을 추적합니다. 이 숫자가 0으로 떨어지면 연결이 비정상입니다. |
CrossClusterOutboundRequests |
|
대상 도메인으로 전송된 검색 요청 수입니다. 클러스터 간 검색 요청의 부하가 도메인을 압도하고 있는지 확인하는 데 사용합니다. 이 지표의 스파이크를/스파이크와 연관시키십시오. JVM CPU |
대상 도메인 지표
지표 | 차원 | 설명 |
---|---|---|
CrossClusterInboundRequests |
|
소스 도메인에서 받은 수신 연결 요청 수입니다. |
연결이 예기치 않게 끊어지는 경우를 대비하여 CloudWatch 경보를 추가하십시오. 경보를 만드는 단계는 정적 임계값 기반 CloudWatch 경보 만들기를 참조하십시오.
클러스터 간 복제 지표
Amazon OpenSearch Service는 클러스터 간 복제에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
ReplicationRate |
초당 평균 복제 작업 속도. 이 지표는 |
LeaderCheckPoint |
특정 연결에 대한 모든 복제 인덱스에 걸친 리더 체크포인트의 합계입니다. 이 지표를 사용하여 복제 대기 시간을 측정할 수 있습니다. |
FollowerCheckPoint |
특정 연결에 대한 모든 복제 인덱스에 걸친 팔로워 체크포인트의 합계입니다. 이 지표를 사용하여 복제 대기 시간을 측정할 수 있습니다. |
ReplicationNumSyncingIndices |
복제 상태가 |
ReplicationNumBootstrappingIndices |
복제 상태가 |
ReplicationNumPausedIndices |
복제 상태가 |
ReplicationNumFailedIndices |
복제 상태가 |
|
팔로워 도메인의 복제 전송 요청 수입니다. 전송 요청은 내부적이며 복제 API 작업이 호출될 때마다 발생합니다. 팔로워 도메인 폴이 리더 도메인에서 변경될 때도 발생합니다. |
|
리더 도메인의 복제 전송 요청 수입니다. 전송 요청은 내부적이며 복제 API 작업이 호출될 때마다 발생합니다. |
AutoFollowNumSuccessStartReplication |
특정 연결에 대한 복제 규칙에 의해 성공적으로 생성된 팔로워 인덱스의 수입니다. |
AutoFollowNumFailedStartReplication |
일치하는 패턴이 있을 때 복제 규칙에 의해 생성되지 못한 팔로워 인덱스의 수입니다. 이 문제는 원격 클러스터의 네트워크 문제 또는 보안 문제(즉, 연결된 역할에 복제를 시작할 권한이 없음)로 인해 발생할 수 있습니다. |
AutoFollowLeaderCallFailure |
새 데이터를 가져오기 위해 팔로워 인덱스에서 리더 인덱스로의 쿼리가 실패했는지 여부입니다. 값 |
순위 학습 지표
Amazon OpenSearch Service는 랭킹 학습에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
LTRRequestTotalCount |
순위 요청의 총 수입니다. |
LTRRequestErrorCount |
실패한 요청의 총 수입니다. |
LTRStatus.red |
플러그 인을 실행하는 데 필요한 인덱스 중 하나가 빨간색인지 추적합니다. |
LTRMemoryUsage |
플러그인이 사용하는 총 메모리입니다. |
LTRFeatureMemoryUsageInBytes |
순위 학습 기능 필드에서 사용되는 메모리의 양(바이트)입니다. |
LTRFeaturesetMemoryUsageInBytes |
모든 순위 학습 기능 집합에서 사용되는 메모리의 양(바이트)입니다. |
LTRModelMemoryUsageInBytes |
모든 순위 학습 모델에서 사용되는 메모리의 양(바이트)입니다. |
파이프 처리 언어 지표
Amazon OpenSearch Service는 파이프 프로세싱 언어에 대해 다음과 같은 지표를 제공합니다.
지표 | 설명 |
---|---|
PPLFailedRequestCountByCusErr |
클라이언트 문제로 인해 |
PPLFailedRequestCountBySysErr |
서버 문제 또는 기능 제한으로 인해 실패한 요청의 수입니다. |
PPLRequestCount |
에 대한 요청 수입니다. |