Amazon CloudWatch を使用したクラスターメトリクスのモニタリング - Amazon Elasticsearch Service

英語の翻訳が提供されている場合で、内容が矛盾する場合には、英語版がオリジナルとして取り扱われます。翻訳は機械翻訳により提供されています。

Amazon CloudWatch を使用したクラスターメトリクスのモニタリング

ヘルスダッシュボードの解釈

Amazon ES コンソールの [Instance health (インスタンスのヘルス)] タブは、箱ひげ図を使用して Elasticsearch ノードごとの正常性に一目でわかる可視性を提供します。

  • それぞれの色付きの箱は、指定した期間におけるノードの値範囲を示しています。

  • 青色の箱は他のノードと同じ値を示します。赤色の箱は異常値を示します。

  • 各箱の白線は、ノードの現在値を示します。

  • 各拍の両脇にある「ひげ」は、期間におけるすべてのノードの最大値と最小値を示します。

Amazon ES ドメインは、1 分ごとにパフォーマンスメトリクスを Amazon CloudWatch に送信します。汎用または磁気 EBS ボリュームを使用する場合は、EBS ボリュームのメトリックスは 5 分ごとのみに更新されます。これらのメトリクスを表示するには、Amazon Elasticsearch Service コンソールで、[クラスターの状態] タブおよび [インスタンスの状態] タブを使用します。このメトリクスには、追加料金はかかりません。

ドメインの設定を変更すると、[クラスターの状態] タブと [インスタンスの状態] タブの各インスタンスのリストが正しい数に戻る前に、しばらくの間 2 倍のサイズになる場合があります。この動作の説明については、「設定変更」を参照してください。

すべてのメトリックは AWS/ES 名前空間。個々のノードのメトリックは、 ClientId, DomainName, NodeId 寸法。クラスタメトリックスは Per-Domain, Per-Client Metrics 寸法。一部のノード メトリックはクラスタ レベルで集計されるため、両方のディメンションに含まれます。サービスは、メトリクスを 2 週間アーカイブし、その後破棄します。

クラスターメトリクス

Amazon Elasticsearch Service には、クラスタに関する次のメトリックスが記載されています。

メトリクス 説明:
ClusterStatus.green

値 1 は、すべてのインデックスシャードがクラスターのノードに割り当てられることを示します。

関連統計: 最大

ClusterStatus.yellow 値 1 は、すべてのインデックスのプライマリシャードがクラスターのノードに割り当てられていることを示しますが、少なくとも 1 つのインデックスのレプリカシャードは割り当てられていません。詳細については、「黄色のクラスター状態」を参照してください。

関連統計: 最大

ClusterStatus.red

値 1 は、少なくとも 1 つのインデックスのプライマリとレプリカの両方のシャードが、クラスターのノードに割り当てられないことを示します。詳細については、「赤のクラスター状態」を参照してください。

関連統計: 最大

Nodes

Amazon ES クラスターのノード数 (例: 専用マスターノードと UltraWarm ノード)。詳細については、「設定変更」を参照してください。

関連統計: 最大

SearchableDocuments

クラスター内のすべてのデータノードで検索可能なドキュメントの合計数。

関連統計: 最小、最大、平均

DeletedDocuments

クラスター内のすべてのデータノードで削除対象としてマークされたドキュメントの合計数。これらのドキュメントは検索結果に表示されなくなっていますが、セグメントマージ中にディスクから削除されたドキュメントのみが Elasticsearch によって削除されます。このメトリクスは、削除リクエスト後に増加し、セグメントマージ後に減少します。

関連統計: 最小、最大、平均

CPUUtilization

クラスター内のデータノードの CPU 使用率の割合。Maximum は、CPU 使用率が最も高いノードを示します。Average は、クラスター内のすべてのノードを表します。このメトリクスは、個別のノードでも利用できます。

関連統計: 最大、平均

FreeStorageSpace

クラスタ内のデータ ノードの空き領域。Sum は、クラスタの合計空き領域を示していますが、正確な値を得るには、1 分経過後にその期間を終了する必要があります。Minimum および Maximum に、空き領域が最も大きいノードと最小のノードをそれぞれ示します。このメトリックは、個々のノードでも使用できます。 Amazon ES は、 ClusterBlockException このメトリックが 0。 リカバリするには、インデックスを削除するか、より大きいインスタンスを追加するか、既存のインスタンスにEBSベースのストレージを追加する必要があります。詳細については、「使用可能なストレージ領域の不足」を参照してください。

Amazon ES コンソールには、この値が GiB 単位で表示されます。Amazon CloudWatch コンソールには、この値が MiB 単位で表示されます。

注記

FreeStorageSpace は、Elasticsearch _cluster/stats API が提供する値より常に低くなります。Amazon ES は、内部オペレーションのために、各インスタンスの記憶域の一定割合を予約します。

関連統計: 最小、最大、平均、合計

ClusterUsedSpace

クラスターの合計使用領域。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

Amazon ES コンソールには、この値が GiB 単位で表示されます。Amazon CloudWatch コンソールには、この値が MiB 単位で表示されます。

関連統計: 最小、最大

ClusterIndexWritesBlocked

クラスターで、着信する書き込みリクエストを受け入れるか、ブロックするかを指定します。値 0 では、クラスターでリクエストを受け入れます。値 1 ではリクエストをブロックします。

クラスターでリクエストをブロックする原因としては、多くの要素が考えられます。一般的な要因には次のようなものがあります。FreeStorageSpace 低すぎると JVMMemoryPressure 高すぎる、または CPUUtilization は高すぎます。この問題を軽減するには、ディスク容量の追加やクラスターのスケーリングを検討します。

関連統計: 最大

JVMMemoryPressure

クラスタ内のすべてのデータノードに使用される Java ヒープの最大パーセント。 Amazon ES は、インスタンスの RAM の半分を Java ヒープ (32 GiB のヒープサイズまで) に使用します。インスタンスは最大 64 GiB の RAM まで垂直スケーリングでき、それ以上はインスタンスを追加することで水平方向にスケーリングできます。「推奨 CloudWatch アラーム」を参照してください)。

関連統計: 最大

AutomatedSnapshotFailure

クラスターの失敗した自動スナップショットの数。1 の値は、自動スナップショットが過去 36 時間、ドメイン用に取られなかったことを示します。

関連統計: 最小、最大

CPUCreditBalance

クラスター内の、データノードに使用できる残りの CPU クレジット。CPU クレジットは、フル CPU パフォーマンスを 1 分間実現します。詳細については、以下を参照してください。 CPUクレジットAmazon EC2 開発者ガイド. このメトリクスは、t2.micro.elasticsearcht2.small.elasticsearcht2.medium.elasticsearch の各インスタンスタイプで使用できます。

関連統計: Minimum

KibanaHealthyNodes

Kibana のヘルスチェック。値 1 は正常な動作を示します。値 0 は Kibana がアクセス不可であることを示します。通常、Kibana の状態はクラスターの状態を反映しています。

関連統計: Minimum

KMSKeyError

値 1 は、保管時のデータを暗号化するために使用される KMS カスタマーマスターが無効になっていることを示します。通常のオペレーションにドメインを復元するには、キーを再度有効にします。コンソールでは、保管時のデータを暗号化するドメインに対してのみこのメトリクスが表示されます。

関連統計: 最小、最大

KMSKeyInaccessible

値 1 は、保管時のデータを暗号化するために使用される KMS カスタマーマスターが削除されたか、Amazon ES への権限が取り消し済みであることを示します。この状態にあるドメインを復元することはできません。ただし、手動のスナップショットがある場合は、それを使用してドメインのデータを新しいドメインに移行できます。コンソールでは、保管時のデータを暗号化するドメインに対してのみこのメトリクスが表示されます。

関連統計: 最小、最大

InvalidHostHeaderRequests

Elasticsearch クラスターに対する HTTP リクエストのうち、ホストヘッダーが無効な (または欠落している) ものの数。有効なリクエストには、ドメインホスト名がホストヘッダー値として必要です。Amazon ES は、制限的なアクセスポリシーを持たないパブリックアクセスドメインの不正なリクエストを拒否します。すべてのドメインに制限付きアクセスポリシーを適用することをお勧めします。

このメトリクスで大きな値が表示される場合は、Elasticsearch クライアントのリクエストにドメインホスト名が含まれていることを確認します (ない場合は、IP アドレスなど)。

関連統計: 合計

ElasticsearchRequests

Elasticsearch クラスターに対するリクエストの数。

関連統計: 合計

2xx, 3xx, 4xx, 5xx

特定の HTTP レスポンスコード (2xx、3xx、4xx、5xx) の発生につながった、ドメインへのリクエストの数。

関連統計: 合計

専用マスターノードメトリクス

Amazon Elasticsearch Service には、次のメトリックスがあります。 専用マスターノード.

メトリクス 説明:
MasterCPUUtilization

専用マスターノードが使用する CPU リソースの最大パーセンテージ。このメトリクスが 60 パーセントに達する場合、インスタンスタイプのサイズを増やすことをお勧めします。

関連統計: 平均

MasterFreeStorageSpace

このメトリクスは関係ないため無視できます。このサービスはデータノードとしてマスターノードを使用しません。

MasterJVMMemoryPressure

クラスター内のすべての専用マスターノードで使用する Java ヒープの最大パーセンテージ。このメトリクスが 85 パーセントに達する場合、より大規模なインスタンスタイプに移行することをお勧めします。

関連統計: 最大

MasterCPUCreditBalance

クラスター内の専用マスターノードで使用できる、残りの CPU クレジット。CPU クレジットは、フル CPU パフォーマンスを 1 分間実現します。詳細については、以下を参照してください。 CPUクレジットLinux インスタンス用 Amazon EC2 ユーザーガイド. このメトリクスは、t2.micro.elasticsearcht2.small.elasticsearcht2.medium.elasticsearch の各インスタンスタイプで使用できます。

関連統計: Minimum

MasterReachableFromNode

MasterNotDiscovered 例外のヘルスチェック。値 1 は正常な動作を示します。値 0 は、/_cluster/health/ の動作が正常ではないことを示します。

動作が正常でないとは、マスターノードが停止しているか、到達不可能であることを意味します。通常、これらの原因はネットワーク接続または AWS 依存関係の問題です。

関連統計: Minimum

MasterSysMemoryUtilization

使用中のマスターノードのメモリの割合。

関連統計: 最大

EBS ボリュームメトリクス

Amazon Elasticsearch Service に、EBSボリュームに関する次のメトリックスを示します。

メトリクス 説明:
ReadLatency

EBS ボリュームでの読み取り操作のレイテンシー (秒単位)。

関連統計: 最小、最大、平均

WriteLatency

EBS ボリュームでの書き込み操作のレイテンシー (秒単位)。

関連統計: 最小、最大、平均

ReadThroughput

EBS ボリュームでの読み取り操作のスループット (バイト/秒単位)。

関連統計: 最小、最大、平均

WriteThroughput

EBS ボリュームでの書き込み操作のスループット (バイト/秒単位)。

関連統計: 最小、最大、平均

DiskQueueDepth

EBS ボリュームに対する保留中の入出力 (I/O) リクエストの数。

関連統計: 最小、最大、平均

ReadIOPS

EBS ボリュームでの読み取り操作の入出力 (I/O) 操作数 (1 秒あたり)。

関連統計: 最小、最大、平均

WriteIOPS

EBS ボリュームでの書き込み操作の入出力 (I/O) 操作数 (1 秒あたり)。

関連統計: 最小、最大、平均

インスタンスメトリクス

Amazon Elasticsearch Service は、ドメイン内の各インスタンスについて次のメトリックスを提供します。 Amazon ES また、これらのインスタンスメトリックスを集計して、クラスタの健全性全体に対する洞察を提供します。この動作を確認するには、コンソールで統計 [データサンプル] を使用します。以下のテーブルの各メトリクスには、ノードクラスターに関連する統計を含みます。

重要

の異なるバージョン Elasticsearch 異なるスレッド プールを使用して、 _index API。 Elasticsearch 1.5および2.3では、インデックス スレッド プールを使用します。 Elasticsearch 5.x、6.0、6.2では、バルク スレッド プールを使用します。 6.3以降は、書き込みスレッド プールを使用します。現在、Amazon ES コンソールにはバルクスレッドプールのグラフは含まれていません。

メトリクス 説明:
IndexingLatency

インデックス作成オペレーションを完了するためにシャードで必要な平均時間 (ミリ秒)。

関連するノード統計: 平均

関連するクラスタ統計: 平均、最大

IndexingRate

1 分あたりのインデックス作成オペレーションの数。2 つのドキュメントを追加し、2 つのカウントを 4 つのオペレーションとして更新する _bulk API への 1 回の呼び出し。これは 1 つ以上のノードに分散する可能性があります。そのインデックスに 1 つ以上のレプリカがある場合、クラスター内の他のノードにも合計 4 つのインデックス作成オペレーションが記録されます。ドキュメントの削除はこのメトリクスに対してカウントされません。

関連するノード統計: 平均

関連するクラスタ統計: 平均、最大、合計

SearchLatency

検索オペレーションを完了するためにデータノードのシャードで必要な平均時間 (ミリ秒)。

関連するノード統計: 平均

関連するクラスタ統計: 平均、最大

SearchRate

データノードのすべてのシャードに対する 1 分あたりの検索リクエストの総数。_search API への 1 回の呼び出しに対して、さまざまなシャードから結果が返される可能性があります。これらのシャードのうちの 5 つが 1 つのノードにある場合、クライアントが 1 つのリクエストしか行っていない場合でも、ノードはこのメトリクスについて 5 を報告します。

関連するノード統計: 平均

関連するクラスタ統計: 平均、最大、合計

SysMemoryUtilization

インスタンスが使用中のメモリの割合。このメトリクスの高い値は正常であり、通常はクラスターに問題はありません。潜在的なパフォーマンスおよび安定性の問題の指標については、「JVMMemoryPressure メトリクス」を参照してください。

関連するノード統計: 最小、最大、平均

関連するクラスタ統計: 最小、最大、平均

JVMGCYoungCollectionCount

「新世代」ガベージコレクションが実行された回数。実行数が大量になり、かつ増え続けることは、通常のクラスター操作の一部です。

関連するノード統計: 最大

関連するクラスタ統計: 合計、最大、平均

JVMGCYoungCollectionTime

クラスターで「新世代」ガベージコレクションの実行にかかった時間 (ミリ秒)。

関連するノード統計: 最大

関連するクラスタ統計: 合計、最大、平均

JVMGCOldCollectionCount

「旧世代」ガベージコレクションが実行された回数。十分なリソースがあるクラスターでは、この回数は少ないままですが、まれに増加します。

関連するノード統計: 最大

関連するクラスタ統計: 合計、最大、平均

JVMGCOldCollectionTime

クラスターで「旧世代」ガベージコレクションの実行にかかった時間 (ミリ秒)。

関連するノード統計: 最大

関連するクラスタ統計: 合計、最大、平均

ThreadpoolForce_mergeQueue

強制マージスレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。

関連するノード統計: 最大

関連するクラスタ統計: 合計、最大、平均

ThreadpoolForce_mergeRejected

強制マージスレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノード統計: 最大

関連するクラスタ統計: 合計

ThreadpoolForce_mergeThreads

強制マージスレッドプールのサイズ。

関連するノード統計: 最大

関連するクラスタ統計: Average、Sum

ThreadpoolIndexQueue

インデックス作成スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。インデックスキューの最大サイズは 200 です。

関連するノード統計: 最大

関連するクラスタ統計: 合計、最大、平均

ThreadpoolIndexRejected

インデックス作成スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノード統計: 最大

関連するクラスタ統計: 合計

ThreadpoolIndexThreads

インデックス作成スレッドプールのサイズ。

関連するノード統計: 最大

関連するクラスタ統計: Average、Sum

ThreadpoolSearchQueue

検索スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。検索キューの最大サイズは 1,000 です。

関連するノード統計: 最大

関連するクラスタ統計: 合計、最大、平均

ThreadpoolSearchRejected

検索スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノード統計: 最大

関連するクラスタ統計: 合計

ThreadpoolSearchThreads

検索スレッドプールのサイズ。

関連するノード統計: 最大

関連するクラスタ統計: Average、Sum

ThreadpoolBulkQueue

バルクスレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。

関連するノード統計: 最大

関連するクラスタ統計: 合計、最大、平均

ThreadpoolBulkRejected

バルクスレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。

関連するノード統計: 最大

関連するクラスタ統計: 合計

ThreadpoolBulkThreads

バルクスレッドプールのサイズ。

関連するノード統計: 最大

関連するクラスタ統計: Average、Sum

ThreadpoolWriteThreads

書き込みスレッドプールのサイズ。

関連するノード統計: 最大

関連するクラスタ統計: Average、Sum

ThreadpoolWriteRejected

書き込みスレッドプールで拒否されたタスクの数。

関連するノード統計: 最大

関連するクラスタ統計: Average、Sum

ThreadpoolWriteQueue

書き込みスレッドプールでキューに入っているタスクの数。

関連するノード統計: 最大

関連するクラスタ統計: Average、Sum

UltraWarm メトリクス

Amazon Elasticsearch Service には、次のメトリックスがあります。 ウルトラウォーム ノード。

メトリクス 説明:
WarmCPUUtilization

クラスター内の UltraWarm ノードの CPU 使用率の割合。Maximum は、CPU 使用率が最も高いノードを示します。Average は、クラスター内のすべての UltraWarm ノードを表します。このメトリクスは、個々の UltraWarm ノードでも利用できます。

関連統計: 最大、平均

WarmFreeStorageSpace

ウォームストレージの空き容量 (MiB)。UltraWarm は、接続されたディスクではなく Amazon S3 を使用するため、Sum は関連する唯一の統計情報です。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

関連統計: 合計

WarmJVMMemoryPressure

UltraWarm ノードで使用する Java ヒープの最大割合。

関連統計: 最大

WarmSearchableDocuments

クラスター内のすべてのウォームインデックスで検索可能なドキュメントの合計数。正確な値を取得するには、期間を 1 分のままにしておく必要があります。

関連統計: 合計

WarmSearchLatency

検索オペレーションを完了するために UltraWarm ノードのシャードで必要な平均時間 (ミリ秒)。

関連するノード統計: 平均

関連するクラスタ統計: 平均、最大

WarmSearchRate

UltraWarm ノードのすべてのシャードに対する 1 分あたりの検索リクエストの総数。_search API への 1 回の呼び出しに対して、さまざまなシャードから結果が返される可能性があります。これらのシャードのうちの 5 つが 1 つのノードにある場合、クライアントが 1 つのリクエストしか行っていない場合でも、ノードはこのメトリクスについて 5 を報告します。

関連するノード統計: 平均

関連するクラスタ統計: 平均、最大、合計

WarmStorageSpaceUtilization

クラスターで使用中のウォームストレージスペースの合計容量。Amazon ES コンソールには、この値が GiB 単位で表示されます。Amazon CloudWatch コンソールには、この値が MiB 単位で表示されます。

関連統計: 最大

HotStorageSpaceUtilization

クラスターで使用しているホットストレージの合計容量。Amazon ES コンソールには、この値が GiB 単位で表示されます。Amazon CloudWatch コンソールには、この値が MiB 単位で表示されます。

関連統計: 最大

WarmSysMemoryUtilization

使用中のウォームノードのメモリの割合。

関連統計: 最大

HotToWarmMigrationQueueSize

現在、ホットストレージからウォームストレージに移行しているインデックスの数。

関連統計: 最大

WarmToHotMigrationQueueSize

現在、ウォームストレージからホットストレージに移行しているインデックスの数。

関連統計: 最大

アラートメトリクス

Amazon Elasticsearch Service には、 アラート機能.

メトリクス 説明:
AlertingDegraded

値 1 は、アラートインデックスが赤であるか、1 つ以上のノードがスケジュールどおりでないことを意味します。値 0 は正常な動作を示します。

関連統計: 最大

AlertingIndexExists

値 1 は、.opendistro-alerting-config インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。アラート機能を初めて使用するまで、この値は 0 のままです。

関連統計: 最大

AlertingIndexStatus.green

インデックスのヘルス。値 1 は、緑を意味します。値 0 は、インデックスが存在しないか、緑ではないことを意味します。

関連統計: 最大

AlertingIndexStatus.red

インデックスのヘルス。値 1 は、赤を意味します。値 0 は、インデックスが存在しないか、赤でないことを意味します。

関連統計: 最大

AlertingIndexStatus.yellow

インデックスのヘルス。値 1 は、黄色を意味します。値 0 は、インデックスが存在しないか、黄色でないことを意味します。

関連統計: 最大

AlertingNodesNotOnSchedule

値 1 は、一部のジョブがスケジュールどおりに実行されていないことを意味します。値 0 は、すべてのアラートジョブがスケジュールどおりに実行されていることを意味します (またはアラートジョブが存在しないことを意味します)。Amazon ES コンソールを確認するか、_nodes/stats リクエストを行って、リソースの使用率が高いノードがあるかどうかを確認します。

関連統計: 最大

AlertingNodesOnSchedule

値 1 は、すべてのアラートジョブがスケジュールどおりに実行されていることを意味します (またはアラートジョブが存在しないことを意味します)。値 0 は、一部のジョブがスケジュールどおりに実行されていないことを意味します。

関連統計: 最大

AlertingScheduledJobEnabled

値 1 は、opendistro.scheduled_jobs.enabled クラスター設定が true であることを意味します。値 0 は、その設定が false であり、スケジュールされたジョブが無効であることを意味します。

関連統計: 最大

異常検出のメトリクス

Amazon Elasticsearch Service には、 異常検出機能.

メトリクス 説明:
AnomalyDetectionPluginUnhealthy

値 1 は、異常検出プラグインが正しく動作していないことを意味します。これは、障害の数が多いか、使用されているインデックスの 1 つが赤の状態であるためです。値 0 は、プラグインが想定どおりに動作していることを示します。

関連統計: 最大

AnomalyDetectionRequestCount

異常検出のリクエストの数。

関連統計: 合計

AnomalyDetectionFailureCount

異常検出に失敗したリクエストの数。

関連統計: 合計

AnomalyResultsIndexStatusIndexExists

値 1 は、.opendistro-anomaly-results エイリアスが指すインデックスが存在することを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連統計: 最大

AnomalyResultsIndexStatus.red

値 1 は、 .opendistro-anomaly-results エイリアスが指すインデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連統計: 最大

AnomalyDetectorsIndexStatusIndexExists

値 1 は、.opendistro-anomaly-detectors インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連統計: 最大

AnomalyDetectorsIndexStatus.red

値 1 は、.opendistro-anomaly-detectors インデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連統計: 最大

ModelsCheckpointIndexStatusIndexExists

値 1 は、.opendistro-anomaly-checkpoints インデックスが存在することを意味します。値 0 は、そのインデックスが存在しないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連統計: 最大

ModelsCheckpointIndexStatus.red

値 1 は、.opendistro-anomaly-checkpoints インデックスが赤の状態であることを意味します。値 0 は、そうでないことを意味します。異常検出機能を初めて使用するまで、この値は 0 のままです。

関連統計: 最大

SQL メトリクス

Amazon Elasticsearch Service には、次のメトリックスがあります。 SQLサポート.

メトリクス 説明:
SQLFailedRequestCountByCusErr

クライアントの問題により失敗した _opendistro/_sql API へのリクエストの数。たとえば、IndexNotFoundException により、リクエストが HTTP ステータスコード 400 を返す場合があります。

関連統計: 合計

SQLFailedRequestCountBySysErr

サーバーの問題または機能の制限により失敗した _opendistro/_sql API へのリクエストの数。たとえば、VerificationException により、リクエストが HTTP ステータスコード 503 を返す場合があります。

関連統計: 合計

SQLRequestCount

_opendistro/_sql API へのリクエストの数。

関連統計: 合計

SQLDefaultCursorRequestCount

SQLRequestCount に似ていますが、カウント対象はページ分割リクエストのみです。

関連統計: 合計

SQLUnhealthy

値 1 は、特定のリクエストへのレスポンスで、SQL プラグインが 5xx レスポンスコードを返すか、無効なクエリ DSL を Elasticsearch に渡すことを示します。他のリクエストは引き続き成功します。値 0 は、最近の障害がないことを示します。値 1 が持続して表示される場合、クライアントがプラグインに対して行っているリクエストのトラブルシューティングを行います。

関連統計: 最大

KNN のメトリクス

Amazon Elasticsearch Service のメトリックを含む クン. それぞれの概要については、Open Distro for Elasticsearch のドキュメントを参照してください。

Amazon Elasticsearch Service には、次のメトリックスがあります。 クラスタ間検索.

ソースドメインのメトリクス

メトリクス ディメンション: 説明:
CrossClusterOutboundConnections

ConnectionId

接続されたノードの数。スキップされたドメインが 1 つ以上レスポンスに含まれている場合は、このメトリクスを使用して異常な接続を追跡します。この数が 0 になった場合、その接続は正常ではありません。

CrossClusterOutboundRequests

ConnectionId

ターゲットドメインに送信された検索リクエストの数。ドメインでクラスター間検索リクエストが過負荷になっているかどうかを確認し、このメトリクスのスパイクと JVM/CPU スパイクの関連性を探るために使用します。

ターゲットドメインのメトリクス

メトリクス ディメンション: 説明:
CrossClusterInboundRequests

ConnectionId

ソースドメインから受信した着信接続リクエストの数。

予期せず接続が切断された場合に CloudWatch アラームを追加します。アラームを作成する手順については、「静的しきい値に基づいて CloudWatch アラームを作成する」を参照してください。

ランキングまでの学習指標

Amazon Elasticsearch Service には、次のメトリックスがあります。 ランク分け.

メトリクス 説明:
LTRRequestTotalCount

ランキングリクエストの合計数。

LTRRequestErrorCount

失敗したリクエストの合計数。

LTRStoreIndexIsRed

プラグインの実行に必要なインデックスの 1 つが赤かどうかを追跡します。

LTRMemoryUsage

プラグインが使用する合計メモリ。