Amazon CloudWatch を使用したクラスターメトリクスのモニタリング - Amazon Elasticsearch Service

Amazon CloudWatch を使用したクラスターメトリクスのモニタリング

ヘルスダッシュボードの解釈

Amazon ES コンソールの [Instance health (インスタンスのヘルス)] タブは、箱ひげ図を使用して Elasticsearch ノードごとの正常性に一目でわかる可視性を提供します。

  • それぞれの色付きの箱は、指定した期間におけるノードの値範囲を示しています。

  • 青色の箱は他のノードと同じ値を示します。赤色の箱は異常値を示します。

  • 各箱の白線は、ノードの現在値を示します。

  • 各拍の両脇にある「ひげ」は、期間におけるすべてのノードの最大値と最小値を示します。

Amazon ES ドメインは、1 分ごとにパフォーマンスメトリクスを Amazon CloudWatch に送信します。汎用または磁気 EBS ボリュームを使用する場合は、EBS ボリュームのメトリックスは 5 分ごとのみに更新されます。これらのメトリクスを表示するには、Amazon Elasticsearch Service コンソールで、[クラスターの状態] タブおよび [インスタンスの状態] タブを使用します。このメトリクスには、追加料金はかかりません。

ドメインの設定を変更すると、[クラスターの状態] タブと [インスタンスの状態] タブの各インスタンスのリストが正しい数に戻る前に、しばらくの間 2 倍のサイズになる場合があります。この動作の説明については、「設定変更」を参照してください。

Amazon ES メトリクスは、これらのカテゴリに分類されます。

注記

サービスは、メトリクスを 2 週間アーカイブし、その後破棄します。

クラスターメトリクス

AWS/ES 名前空間には、次のクラスターのメトリクスが含まれます。

メトリクス 説明
ClusterStatus.green

値 1 は、すべてのインデックスシャードがクラスターのノードに割り当てられることを示します。

関連する統計: Maximum

ClusterStatus.yellow 値 1 は、すべてのインデックスのプライマリシャードがクラスターのノードに割り当てられていることを示しますが、少なくとも 1 つのインデックスのレプリカシャードは割り当てられていません。詳細については、「黄色のクラスター状態」を参照してください。

関連する統計: Maximum

ClusterStatus.red

値 1 は、少なくとも 1 つのインデックスのプライマリとレプリカの両方のシャードが、クラスターのノードに割り当てられないことを示します。詳細については、「赤のクラスター状態」を参照してください。

関連する統計: Maximum

Nodes

Amazon ES クラスターのノード数 (例: 専用マスターノードと UltraWarm ノード)。詳細については、「設定変更」を参照してください。

関連する統計: Maximum

SearchableDocuments

クラスター内のすべてのデータノードで検索可能なドキュメントの合計数。

関連する統計: Minimum、Maximum、Average

DeletedDocuments

クラスター内のすべてのデータノードで削除対象としてマークされたドキュメントの合計数。これらのドキュメントは検索結果に表示されなくなっていますが、セグメントマージ中にディスクから削除されたドキュメントのみが Elasticsearch によって削除されます。このメトリクスは、削除リクエスト後に増加し、セグメントマージ後に減少します。

関連する統計: Minimum、Maximum、Average

CPUUtilization

クラスター内のデータノードの CPU 使用率の割合。Maximum は、CPU 使用率が最も高いノードを示します。Average は、クラスター内のすべてのノードを表します。このメトリクスは、個別のノードでも利用できます。

関連する統計: Maximum、Average

FreeStorageSpace

クラスター内のデータノードの空き領域。Sum はクラスターの合計空き容量を示しますが、正確な値を得るには期間を 1 分にする必要があります。MinimumMaximum は、それぞれ空き領域が最も多いノードと最も少ないノードを示します。このメトリクスは、個別のノードでも利用できます。メトリクスが 0 に達すると、Amazon ES は ClusterBlockException をスローします。復旧するには、インデックスを削除する、より大きなインスタンスを追加する、既存のインスタンスに EBS ベースのストレージを追加する、のいずれかを実行する必要があります。詳細については、「使用可能なストレージ領域の不足」を参照してください。

Amazon ES コンソールには、この値が GiB 単位で表示されます。Amazon CloudWatch コンソールには、この値が MiB 単位で表示されます。

注記

FreeStorageSpace は、Elasticsearch _cluster/stats API が提供する値より常に低くなります。Amazon ES は、内部オペレーションのために、各インスタンスの記憶域の一定割合を予約します。

関連する統計: Minimum、Maximum、Average、Sum

ClusterUsedSpace

クラスターの合計使用領域。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

Amazon ES コンソールには、この値が GiB 単位で表示されます。Amazon CloudWatch コンソールには、この値が MiB 単位で表示されます。

関連する統計: Minimum、Maximum

ClusterIndexWritesBlocked

クラスターで、着信する書き込みリクエストを受け入れるか、ブロックするかを指定します。値 0 では、クラスターでリクエストを受け入れます。値 1 ではリクエストをブロックします。

クラスターでリクエストをブロックする原因としては、多くの要素が考えられます。代表的なものとしては、FreeStorageSpace が少なすぎる、JVMMemoryPressure が高すぎる、CPUUtilization が高すぎるなどがあります。この問題を軽減するには、ディスク容量の追加やクラスターのスケーリングを検討します。

関連する統計: Maximum

JVMMemoryPressure

クラスター内のすべてのデータノードで使用する Java ヒープの最大パーセンテージ。Amazon ES は、インスタンスの RAM の半分を Java ヒープ (32 GiB のヒープサイズまで) に使用します。インスタンスは最大 64 GiB の RAM まで垂直スケーリングでき、それ以上はインスタンスを追加することで水平方向にスケーリングできます。「推奨 CloudWatch アラーム」を参照してください。

関連する統計: Maximum

AutomatedSnapshotFailure

クラスターの失敗した自動スナップショットの数。1 の値は、自動スナップショットが過去 36 時間、ドメイン用に取られなかったことを示します。

関連する統計: Minimum、Maximum

CPUCreditBalance

クラスター内の、データノードに使用できる残りの CPU クレジット。CPU クレジットは、フル CPU パフォーマンスを 1 分間実現します。詳細については、Amazon EC2 開発者ガイドの「CPU クレジット」を参照してください。このメトリクスは、t2.micro.elasticsearcht2.small.elasticsearcht2.medium.elasticsearch の各インスタンスタイプで使用できます。

関連する統計: Minimum

KibanaHealthyNodes

Kibana のヘルスチェック。値 1 は正常な動作を示します。値 0 は Kibana がアクセス不可であることを示します。通常、Kibana の状態はクラスターの状態を反映しています。

関連する統計: Minimum

KMSKeyError

値 1 は、保管時のデータを暗号化するために使用される KMS カスタマーマスターが無効になっていることを示します。通常のオペレーションにドメインを復元するには、キーを再度有効にします。コンソールでは、保管時のデータを暗号化するドメインに対してのみこのメトリクスが表示されます。

関連する統計: Minimum、Maximum

KMSKeyInaccessible

値 1 は、保管時のデータを暗号化するために使用される KMS カスタマーマスターが削除されたか、Amazon ES への権限が取り消し済みであることを示します。この状態にあるドメインを復元することはできません。ただし、手動のスナップショットがある場合は、それを使用してドメインのデータを新しいドメインに移行できます。コンソールでは、保管時のデータを暗号化するドメインに対してのみこのメトリクスが表示されます。

関連する統計: Minimum、Maximum

InvalidHostHeaderRequests

Elasticsearch クラスターに対する HTTP リクエストのうち、ホストヘッダーが無効な (または欠落している) ものの数。有効なリクエストには、ドメインホスト名がホストヘッダー値として必要です。Amazon ES は、制限的なアクセスポリシーを持たないパブリックアクセスドメインの不正なリクエストを拒否します。すべてのドメインに制限付きアクセスポリシーを適用することをお勧めします。

このメトリクスで大きな値が表示される場合は、Elasticsearch クライアントのリクエストにドメインホスト名が含まれていることを確認します (ない場合は、IP アドレスなど)。

関連する統計: Sum

ElasticsearchRequests

Elasticsearch クラスターに対するリクエストの数。

関連する統計: Sum

2xx, 3xx, 4xx, 5xx

特定の HTTP レスポンスコード (2xx、3xx、4xx、5xx) の発生につながった、ドメインへのリクエストの数。

関連する統計: Sum

専用マスターノードメトリクス

AWS/ES 名前空間には、専用マスターノードの以下のメトリクスが含まれます。

メトリクス 説明
MasterCPUUtilization

専用マスターノードが使用する CPU リソースの最大パーセンテージ。このメトリクスが 60 パーセントに達する場合、インスタンスタイプのサイズを増やすことをお勧めします。

関連する統計: Average

MasterFreeStorageSpace

このメトリクスは関係ないため無視できます。このサービスはデータノードとしてマスターノードを使用しません。

MasterJVMMemoryPressure

クラスター内のすべての専用マスターノードで使用する Java ヒープの最大パーセンテージ。このメトリクスが 85 パーセントに達する場合、より大規模なインスタンスタイプに移行することをお勧めします。

関連する統計: Maximum

MasterCPUCreditBalance

クラスター内の専用マスターノードで使用できる、残りの CPU クレジット。CPU クレジットは、フル CPU パフォーマンスを 1 分間実現します。詳細については、Linux インスタンス用 Amazon EC2 ユーザーガイド の「CPU クレジット」を参照してください。このメトリクスは、t2.micro.elasticsearcht2.small.elasticsearcht2.medium.elasticsearch の各インスタンスタイプで使用できます。

関連する統計: Minimum

MasterReachableFromNode

MasterNotDiscovered 例外のヘルスチェック。値 1 は正常な動作を示します。値 0 は、/_cluster/health/ の動作が正常ではないことを示します。

動作が正常でないとは、マスターノードが停止しているか、到達不可能であることを意味します。通常、これらの原因はネットワーク接続または AWS 依存関係の問題です。

関連する統計: Minimum

MasterSysMemoryUtilization

使用中のマスターノードのメモリの割合。

関連する統計: Maximum

EBS ボリュームメトリクス

AWS/ES 名前空間には、次の EBS ボリュームのメトリクスが含まれます。

メトリクス 説明
ReadLatency

EBS ボリュームでの読み取り操作のレイテンシー (秒単位)。

関連する統計: Minimum、Maximum、Average

WriteLatency

EBS ボリュームでの書き込み操作のレイテンシー (秒単位)。

関連する統計: Minimum、Maximum、Average

ReadThroughput

EBS ボリュームでの読み取り操作のスループット (バイト/秒単位)。

関連する統計: Minimum、Maximum、Average

WriteThroughput

EBS ボリュームでの書き込み操作のスループット (バイト/秒単位)。

関連する統計: Minimum、Maximum、Average

DiskQueueDepth

EBS ボリュームに対する保留中の入出力 (I/O) リクエストの数。

関連する統計: Minimum、Maximum、Average

ReadIOPS

EBS ボリュームでの読み取り操作の入出力 (I/O) 操作数 (1 秒あたり)。

関連する統計: Minimum、Maximum、Average

WriteIOPS

EBS ボリュームでの書き込み操作の入出力 (I/O) 操作数 (1 秒あたり)。

関連する統計: Minimum、Maximum、Average

インスタンスメトリクス

AWS/ES 名前空間には、ドメイン内のインスタンスごとに以下のメトリクスが含まれています。また、Amazon ES では、これらのインスタンスメトリクスを集約することで、クラスター全体の正常性に関する洞察が得られます。この動作を確認するには、コンソールで統計 [データサンプル] を使用します。以下のテーブルの各メトリクスには、ノードクラスターに関連する統計を含みます。

重要

Elasticsearch のバージョンが異なる場合、_index API への呼び出しの処理にも異なるスレッドプールが使用されます。Elasticsearch 1.5 および 2.3 は、インデックス作成スレッドプールを使用します。Elasticsearch 5.x、6.0、および 6.2 はバルクスレッドプールを使用します。6.3 以降では書き込みスレッドプールを使用します。現在、Amazon ES コンソールにはバルクスレッドプールのグラフは含まれていません。

メトリクス 説明
IndexingLatency

インデックス作成オペレーションを完了するためにシャードで必要な平均時間 (ミリ秒)。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum

IndexingRate

1 分あたりのインデックス作成オペレーションの数。2 つのドキュメントを追加し、2 つのカウントを 4 つのオペレーションとして更新する _bulk API への 1 回の呼び出し。これは 1 つ以上のノードに分散する可能性があります。そのインデックスに 1 つ以上のレプリカがある場合、クラスター内の他のノードにも合計 4 つのインデックス作成オペレーションが記録されます。ドキュメントの削除はこのメトリクスに対してカウントされません。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum、Sum

SearchLatency

検索オペレーションを完了するためにデータノードのシャードで必要な平均時間 (ミリ秒)。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum

SearchRate

データノードのすべてのシャードに対する 1 分あたりの検索リクエストの総数。_search API への 1 回の呼び出しに対して、さまざまなシャードから結果が返される可能性があります。これらのシャードのうちの 5 つが 1 つのノードにある場合、クライアントが 1 つのリクエストしか行っていない場合でも、ノードはこのメトリクスについて 5 を報告します。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum、Sum

SysMemoryUtilization

インスタンスが使用中のメモリの割合。このメトリクスの高い値は正常であり、通常はクラスターに問題はありません。潜在的なパフォーマンスおよび安定性の問題の指標については、「JVMMemoryPressure メトリクス」を参照してください。

関連するノードの統計: Minimum、Maximum、Average

関連するクラスターの統計: Minimum、Maximum、Average

JVMGCYoungCollectionCount

「新世代」ガベージコレクションが実行された回数。実行数が大量になり、かつ増え続けることは、通常のクラスター操作の一部です。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

JVMGCYoungCollectionTime

クラスターで「新世代」ガベージコレクションの実行にかかった時間 (ミリ秒)。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

JVMGCOldCollectionCount

「旧世代」ガベージコレクションが実行された回数。十分なリソースがあるクラスターでは、この回数は少ないままですが、まれに増加します。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

JVMGCOldCollectionTime

クラスターで「旧世代」ガベージコレクションの実行にかかった時間 (ミリ秒)。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolForce_mergeQueue

強制マージスレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolForce_mergeRejected

強制マージスレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolForce_mergeThreads

強制マージスレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolIndexQueue

インデックス作成スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。インデックスキューの最大サイズは 200 です。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolIndexRejected

インデックス作成スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolIndexThreads

インデックス作成スレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolSearchQueue

検索スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。検索キューの最大サイズは 1,000 です。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolSearchRejected

検索スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolSearchThreads

検索スレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolBulkQueue

バルクスレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum、Maximum、Average

ThreadpoolBulkRejected

バルクスレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノードの統計: Maximum

関連するクラスターの統計: Sum

ThreadpoolBulkThreads

バルクスレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolWriteThreads

書き込みスレッドプールのサイズ。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolWriteRejected

書き込みスレッドプールで拒否されたタスクの数。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

ThreadpoolWriteQueue

書き込みスレッドプールでキューに入っているタスクの数。

関連するノードの統計: Maximum

関連するクラスターの統計: Average、Sum

UltraWarm メトリクス

AWS/ES 名前空間には、UltraWarm ノードの以下のメトリクスが含まれます。

メトリクス 説明
WarmCPUUtilization

クラスター内の UltraWarm ノードの CPU 使用率の割合。Maximum は、CPU 使用率が最も高いノードを示します。Average は、クラスター内のすべての UltraWarm ノードを表します。このメトリクスは、個々の UltraWarm ノードでも利用できます。

関連する統計: Maximum、Average

WarmFreeStorageSpace

ウォームストレージの空き容量 (MiB)。UltraWarm は、接続されたディスクではなく Amazon S3 を使用するため、Sum は関連する唯一の統計情報です。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

関連する統計: Sum

WarmJVMMemoryPressure

UltraWarm ノードで使用する Java ヒープの最大割合。

関連する統計: Maximum

WarmSearchableDocuments

クラスター内のすべてのウォームインデックスで検索可能なドキュメントの合計数。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

関連する統計: Sum

WarmSearchLatency

検索オペレーションを完了するために UltraWarm ノードのシャードで必要な平均時間 (ミリ秒)。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum

WarmSearchRate

UltraWarm ノードのすべてのシャードに対する 1 分あたりの検索リクエストの総数。_search API への 1 回の呼び出しに対して、さまざまなシャードから結果が返される可能性があります。これらのシャードのうちの 5 つが 1 つのノードにある場合、クライアントが 1 つのリクエストしか行っていない場合でも、ノードはこのメトリクスについて 5 を報告します。

関連するノードの統計: Average

関連するクラスターの統計: Average、Maximum、Sum

WarmStorageSpaceUtilization

クラスターで使用中のウォームストレージスペースの合計容量。Amazon ES コンソールには、この値が GiB 単位で表示されます。Amazon CloudWatch コンソールには、この値が MiB 単位で表示されます。

関連する統計: Max

HotStorageSpaceUtilization

クラスターで使用しているホットストレージの合計容量。Amazon ES コンソールには、この値が GiB 単位で表示されます。Amazon CloudWatch コンソールには、この値が MiB 単位で表示されます。

関連する統計: Max

WarmSysMemoryUtilization

使用中のウォームノードのメモリの割合。

関連する統計: Maximum

HotToWarmMigrationQueueSize

現在、ホットストレージからウォームストレージに移行しているインデックスの数。

関連する統計: Maximum

WarmToHotMigrationQueueSize

現在、ウォームストレージからホットストレージに移行しているインデックスの数。

関連する統計: Maximum

アラートメトリクス

AWS/ES 名前空間には、アラート機能の以下のメトリクスが含まれます。

メトリクス 説明
AlertingDegraded

値 1 は、アラートインデックスが赤であるか、1 つ以上のノードがスケジュールどおりでないことを意味します。値 0 は正常な動作を示します。

関連する統計: Maximum

AlertingIndexExists

値 1 は、.opendistro-alerting-config インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。アラート機能を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

AlertingIndexStatus.green

インデックスのヘルス。値 1 は、緑を意味します。値 0 は、インデックスが存在しないか、緑ではないことを意味します。

関連する統計: Maximum

AlertingIndexStatus.red

インデックスのヘルス。値 1 は、赤を意味します。値 0 は、インデックスが存在しないか、赤でないことを意味します。

関連する統計: Maximum

AlertingIndexStatus.yellow

インデックスのヘルス。値 1 は、黄色を意味します。値 0 は、インデックスが存在しないか、黄色でないことを意味します。

関連する統計: Maximum

AlertingNodesNotOnSchedule

値 1 は、一部のジョブがスケジュールどおりに実行されていないことを意味します。値 0 は、すべてのアラートジョブがスケジュールどおりに実行されていることを意味します (またはアラートジョブが存在しないことを意味します)。Amazon ES コンソールを確認するか、_nodes/stats リクエストを行って、リソースの使用率が高いノードがあるかどうかを確認します。

関連する統計: Maximum

AlertingNodesOnSchedule

値 1 は、すべてのアラートジョブがスケジュールどおりに実行されていることを意味します (またはアラートジョブが存在しないことを意味します)。値 0 は、一部のジョブがスケジュールどおりに実行されていないことを意味します。

関連する統計: Maximum

AlertingScheduledJobEnabled

値 1 は、opendistro.scheduled_jobs.enabled クラスター設定が true であることを意味します。値 0 は、その設定が false であり、スケジュールされたジョブが無効であることを意味します。

関連する統計: Maximum

異常検出のメトリクス

AWS/ES 名前空間には、異常検出機能に関する以下のメトリクスが含まれています。

メトリクス 説明
AnomalyDetectionPluginUnhealthy

値 1 は、異常検出プラグインが正しく動作していないことを意味します。これは、障害の数が多いか、使用されているインデックスの 1 つが赤の状態であるためです。値 0 は、プラグインが想定どおりに動作していることを示します。

関連する統計: Maximum

AnomalyDetectionRequestCount

異常検出のリクエストの数。

関連する統計: Sum

AnomalyDetectionFailureCount

異常検出に失敗したリクエストの数。

関連する統計: Sum

AnomalyResultsIndexStatusIndexExists

値 1 は、.opendistro-anomaly-results エイリアスが指すインデックスが存在することを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

AnomalyResultsIndexStatus.red

値 1 は、 .opendistro-anomaly-results エイリアスが指すインデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

AnomalyDetectorsIndexStatusIndexExists

値 1 は、.opendistro-anomaly-detectors インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

AnomalyDetectorsIndexStatus.red

値 1 は、.opendistro-anomaly-detectors インデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

ModelsCheckpointIndexStatusIndexExists

値 1 は、.opendistro-anomaly-checkpoints インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

ModelsCheckpointIndexStatus.red

値 1 は、.opendistro-anomaly-checkpoints インデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連する統計: Maximum

SQL メトリクス

AWS/ES 名前空間には、SQL サポートの以下のメトリクスが含まれます。

メトリクス 説明
SQLFailedRequestCountByCusErr

クライアントの問題により失敗した _opendistro/_sql API へのリクエストの数。たとえば、IndexNotFoundException により、リクエストが HTTP ステータスコード 400 を返す場合があります。

関連する統計: Sum

SQLFailedRequestCountBySysErr

サーバーの問題または機能の制限により失敗した _opendistro/_sql API へのリクエストの数。たとえば、VerificationException により、リクエストが HTTP ステータスコード 503 を返す場合があります。

関連する統計: Sum

SQLRequestCount

_opendistro/_sql API へのリクエストの数。

関連する統計: Sum

SQLDefaultCursorRequestCount

SQLRequestCount に似ていますが、カウント対象はページ分割リクエストのみです。

関連する統計: Sum

SQLUnhealthy

値 1 は、特定のリクエストへのレスポンスで、SQL プラグインが 5xx レスポンスコードを返すか、無効なクエリ DSL を Elasticsearch に渡すことを示します。他のリクエストは引き続き成功します。値 0 は、最近の障害がないことを示します。値 1 が持続して表示される場合、クライアントがプラグインに対して行っているリクエストのトラブルシューティングを行います。

関連する統計: Maximum

KNN のメトリクス

AWS/ES 名前空間には、KNN のメトリクスが含まれます。それぞれの概要については、Open Distro for Elasticsearch のドキュメントを参照してください。

AWS/ES 名前空間には、クラスター間検索に関する次のメトリクスが含まれています。

ソースドメインのメトリクス

メトリクス ディメンション 説明
CrossClusterOutboundConnections

ConnectionId

接続されたノードの数。スキップされたドメインが 1 つ以上レスポンスに含まれている場合は、このメトリクスを使用して異常な接続を追跡します。この数が 0 になった場合、その接続は正常ではありません。

CrossClusterOutboundRequests

ConnectionId

ターゲットドメインに送信された検索リクエストの数。ドメインでクラスター間検索リクエストが過負荷になっているかどうかを確認し、このメトリクスのスパイクと JVM/CPU スパイクの関連性を探るために使用します。

ターゲットドメインのメトリクス

メトリクス ディメンション 説明
CrossClusterInboundRequests

ConnectionId

ソースドメインから受信した着信接続リクエストの数。

予期せず接続が切断された場合に CloudWatch アラームを追加します。アラームを作成する手順については、「静的しきい値に基づいて CloudWatch アラームを作成する」を参照してください。