「翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。」
によるクラスターメトリクスのモニタリングAmazon CloudWatch
ヘルスダッシュボードの解釈
The Instance health tab in the Amazon ES console uses box charts to provide at-a-glance visibility into the health of each Elasticsearch node.

-
それぞれの色付きの箱は、指定した期間におけるノードの値範囲を示しています。
-
青色の箱は他のノードと同じ値を示します。赤色の箱は異常値を示します。
-
各箱の白線は、ノードの現在値を示します。
-
各拍の両脇にある「ひげ」は、期間におけるすべてのノードの最大値と最小値を示します。
Amazon ES ドメインは、1 分ごとにパフォーマンスメトリクスを Amazon CloudWatch に送信します。汎用または磁気 EBS ボリュームを使用する場合は、EBS ボリュームのメトリックスは 5 分ごとのみに更新されます。To view these metrics, use the Cluster health and Instance health tabs in the Amazon Elasticsearch Service console. このメトリクスには、追加料金はかかりません。
If you make configuration changes to your domain, the list of individual instances in the Cluster health and Instance health tabs often double in size for a brief period before returning to the correct number. この動作の説明については、「」を参照してください。設定変更.
All metrics are in the AWS/ES
namespace. Metrics for individual nodes are in the ClientId, DomainName, NodeId
dimension. Cluster metrics are in the Per-Domain, Per-Client Metrics
dimension. Some node metrics are aggregated at the cluster level and thus included
in both dimensions. サービスは、メトリクスを 2 週間アーカイブし、その後破棄します。
クラスターメトリクス
Amazon Elasticsearch Service provides the following metrics for clusters.
メトリクス | 説明 |
---|---|
ClusterStatus.green |
値 1 は、すべてのインデックスシャードがクラスターのノードに割り当てられることを示します。 関連する統計: Maximum |
ClusterStatus.yellow |
値 1 は、すべてのインデックスのプライマリシャードがクラスターのノードに割り当てられていることを示しますが、少なくとも 1 つのインデックスのレプリカシャードは割り当てられていません。詳細については、「」を参照してください。黄色のクラスター状態.
関連する統計: Maximum |
ClusterStatus.red |
値 1 は、少なくとも 1 つのインデックスのプライマリとレプリカの両方のシャードが、クラスターのノードに割り当てられないことを示します。詳細については、「」を参照してください。赤のクラスター状態. 関連する統計: Maximum |
Nodes |
The number of nodes in the Amazon ES cluster, including dedicated master nodes and UltraWarm nodes. 詳細については、「」を参照してください。設定変更. 関連する統計: Maximum |
SearchableDocuments |
クラスター内のすべてのデータノードで検索可能なドキュメントの合計数。 関連する統計: Minimum、Maximum、Average |
DeletedDocuments |
クラスター内のすべてのデータノードで削除対象としてマークされたドキュメントの合計数。これらのドキュメントは検索結果に表示されなくなっていますが、セグメントマージ中にディスクから削除されたドキュメントのみが Elasticsearch によって削除されます。このメトリクスは、削除リクエスト後に増加し、セグメントマージ後に減少します。 関連する統計: Minimum、Maximum、Average |
CPUUtilization |
クラスター内のデータノードの CPU 使用率の割合。Maximum は、CPU 使用率が最も高いノードを示します。Average は、クラスター内のすべてのノードを表します。このメトリクスは、個別のノードでも利用できます。 関連する統計: Maximum、Average |
FreeStorageSpace |
The free space for data nodes in the cluster. The Amazon ES console displays this value in GiB. The Amazon CloudWatch console displays it in MiB.
関連する統計: Minimum、Maximum、Average、Sum |
ClusterUsedSpace |
クラスターの合計使用領域。正確な値を取得するには、期間を 1 分のままにしておく必要があります。 The Amazon ES console displays this value in GiB. The Amazon CloudWatch console displays it in MiB. 関連する統計: Minimum、Maximum |
ClusterIndexWritesBlocked |
クラスターで、着信する書き込みリクエストを受け入れるか、ブロックするかを指定します。値 0 では、クラスターでリクエストを受け入れます。値 1 ではリクエストをブロックします。 Some common factors include the following: 関連する統計: Maximum |
JVMMemoryPressure |
The maximum percentage of the Java heap used for all data nodes in the cluster. Amazon ES は、インスタンスの RAM の半分を Java ヒープ (32 GiB のヒープサイズまで) に使用します。インスタンスは最大 64 GiB の RAM まで垂直スケーリングでき、それ以上はインスタンスを追加することで水平方向にスケーリングできます。 」を参照してください。推奨 CloudWatch アラーム. 関連する統計: Maximum |
AutomatedSnapshotFailure |
クラスターの失敗した自動スナップショットの数。 関連する統計: Minimum、Maximum |
CPUCreditBalance |
クラスター内の、データノードに使用できる残りの CPU クレジット。CPU クレジットは、フル CPU パフォーマンスを 1 分間実現します。For more information, see CPU credits in the Amazon EC2 Developer Guide. This metric is available only for the T2 instance types. 関連する統計: Minimum |
KibanaHealthyNodes |
Kibana のヘルスチェック。値 1 は正常な動作を示します。値 0 は Kibana がアクセス不可であることを示します。通常、Kibana の状態はクラスターの状態を反映しています。 関連する統計: Minimum |
KMSKeyError |
値 1 は、保管時のデータを暗号化するために使用される KMS カスタマーマスターが無効になっていることを示します。通常のオペレーションにドメインを復元するには、キーを再度有効にします。コンソールでは、保管時のデータを暗号化するドメインに対してのみこのメトリクスが表示されます。 関連する統計: Minimum、Maximum |
KMSKeyInaccessible |
値 1 は、保管時のデータを暗号化するために使用される KMS カスタマーマスターが削除されたか、 への権限が取り消し済みであることを示します。Amazon ES. この状態にあるドメインを復元することはできません。ただし、手動のスナップショットがある場合は、それを使用してドメインのデータを新しいドメインに移行できます。コンソールでは、保管時のデータを暗号化するドメインに対してのみこのメトリクスが表示されます。 関連する統計: Minimum、Maximum |
InvalidHostHeaderRequests |
Elasticsearch クラスターに対する HTTP リクエストのうち、ホストヘッダーが無効な (または欠落している) ものの数。有効なリクエストには、ドメインホスト名がホストヘッダー値として必要です。Amazon ES は、制限的なアクセスポリシーを持たないパブリックアクセスドメインの不正なリクエストを拒否します。すべてのドメインに制限付きアクセスポリシーを適用することをお勧めします。 このメトリクスで大きな値が表示される場合は、Elasticsearch クライアントのリクエストにドメインホスト名が含まれていることを確認します (ない場合は、IP アドレスなど)。 関連する統計: Sum |
ElasticsearchRequests |
Elasticsearch クラスターに対するリクエストの数。 関連する統計: Sum |
2xx, 3xx, 4xx, 5xx |
特定の HTTP レスポンスコード (2xx、3xx、4xx、5xx).) の発生につながった、ドメインへのリクエストの数。 関連する統計: Sum |
専用マスターノードメトリクス
Amazon Elasticsearch Service provides the following metrics for dedicated master nodes.
メトリクス | 説明 |
---|---|
MasterCPUUtilization |
専用マスターノードが使用する CPU リソースの最大パーセンテージ。このメトリクスが 60 パーセントに達する場合、インスタンスタイプのサイズを増やすことをお勧めします。 関連する統計: Average |
MasterFreeStorageSpace |
このメトリクスは関係ないため無視できます。このサービスはデータノードとしてマスターノードを使用しません。 |
MasterJVMMemoryPressure |
クラスター内のすべての専用マスターノードで使用する Java ヒープの最大パーセンテージ。このメトリクスが 85 パーセントに達する場合、より大規模なインスタンスタイプに移行することをお勧めします。 関連する統計: Maximum |
MasterCPUCreditBalance |
クラスター内の専用マスターノードで使用できる、残りの CPU クレジット。CPU クレジットは、フル CPU パフォーマンスを 1 分間実現します。For more information, see CPU credits in the Amazon EC2 Developer Guide. This metric is available only for the T2 instance types. 関連する統計: Minimum |
MasterReachableFromNode |
動作が正常でないとは、マスターノードが停止しているか、到達不可能であることを意味します。通常、これらの原因はネットワーク接続または AWS 依存関係の問題です。 関連する統計: Minimum |
MasterSysMemoryUtilization |
使用中のマスターノードのメモリの割合。 関連する統計: Maximum |
EBS ボリュームメトリクス
Amazon Elasticsearch Service provides the following metrics for EBS volumes.
メトリクス | 説明 |
---|---|
ReadLatency |
EBS ボリュームでの読み取り操作のレイテンシー (秒単位)。 関連する統計: Minimum、Maximum、Average |
WriteLatency |
EBS ボリュームでの書き込み操作のレイテンシー (秒単位)。 関連する統計: Minimum、Maximum、Average |
ReadThroughput |
EBS ボリュームでの読み取り操作のスループット (バイト/秒単位)。 関連する統計: Minimum、Maximum、Average |
WriteThroughput |
EBS ボリュームでの書き込み操作のスループット (バイト/秒単位)。 関連する統計: Minimum、Maximum、Average |
DiskQueueDepth |
EBS ボリュームに対する保留中の入出力 (I/O) リクエストの数。 関連する統計: Minimum、Maximum、Average |
ReadIOPS |
EBS ボリュームでの読み取り操作の入出力 (I/O) 操作数 (1 秒あたり)。 関連する統計: Minimum、Maximum、Average |
WriteIOPS |
EBS ボリュームでの書き込み操作の入出力 (I/O) 操作数 (1 秒あたり)。 関連する統計: Minimum、Maximum、Average |
インスタンスメトリクス
Amazon Elasticsearch Service provides the following metrics for each instance in a domain. Amazon ES also aggregates these instance metrics to provide insight into overall cluster health. You can verify this behavior using the Data samples statistic in the console. Note that each metric in the following table has relevant statistics for the node and the cluster.
Different versions of Elasticsearch use different thread pools to process calls to
the _index
API. Elasticsearch 1.5 and 2.3 use the index thread pool. Elasticsearch 5.x, 6.0, and 6.2 use the bulk thread pool. 6.3 and later use the write thread pool.
現在、Amazon ES コンソールにはバルクスレッドプールのグラフは含まれていません。
Use GET _cluster/settings?include_defaults=true
to check thread pool and queue sizes for your cluster.
メトリクス | 説明 |
---|---|
IndexingLatency |
インデックス作成オペレーションを完了するためにシャードで必要な平均時間 (ミリ秒)。 関連するノードの統計: Average 関連するクラスターの統計: Average、Maximum |
IndexingRate |
1 分あたりのインデックス作成オペレーションの数。2 つのドキュメントを追加し、2 つのカウントを 4 つのオペレーションとして更新する 関連するノードの統計: Average 関連するクラスターの統計: Average、Maximum、Sum |
SearchLatency |
検索オペレーションを完了するためにデータノードのシャードで必要な平均時間 (ミリ秒)。 関連するノードの統計: Average 関連するクラスターの統計: Average、Maximum |
SearchRate |
データノードのすべてのシャードに対する 1 分あたりの検索リクエストの総数。 関連するノードの統計: Average 関連するクラスターの統計: Average、Maximum、Sum |
SysMemoryUtilization |
インスタンスが使用中のメモリの割合。このメトリクスの高い値は正常であり、通常はクラスターに問題はありません。潜在的なパフォーマンスおよび安定性の問題の指標については、「 関連するノードの統計: Minimum、Maximum、Average 関連するクラスターの統計: Minimum、Maximum、Average |
JVMGCYoungCollectionCount |
「新世代」ガベージコレクションが実行された回数。実行数が大量になり、かつ増え続けることは、通常のクラスター操作の一部です。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum、Maximum、Average |
JVMGCYoungCollectionTime |
クラスターで「新世代」ガベージコレクションの実行にかかった時間 (ミリ秒)。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum、Maximum、Average |
JVMGCOldCollectionCount |
「旧世代」ガベージコレクションが実行された回数。十分なリソースがあるクラスターでは、この回数は少ないままですが、まれに増加します。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum、Maximum、Average |
JVMGCOldCollectionTime |
クラスターで「旧世代」ガベージコレクションの実行にかかった時間 (ミリ秒)。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum、Maximum、Average |
ThreadpoolForce_mergeQueue |
強制マージスレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum、Maximum、Average |
ThreadpoolForce_mergeRejected |
強制マージスレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum |
ThreadpoolForce_mergeThreads |
強制マージスレッドプールのサイズ。 関連するノードの統計: Maximum 関連するクラスターの統計: Average、Sum |
ThreadpoolIndexQueue |
インデックス作成スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。インデックスキューの最大サイズは 200 です。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum、Maximum、Average |
ThreadpoolIndexRejected |
インデックス作成スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum |
ThreadpoolIndexThreads |
インデックス作成スレッドプールのサイズ。 関連するノードの統計: Maximum 関連するクラスターの統計: Average、Sum |
ThreadpoolSearchQueue |
検索スレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。検索キューの最大サイズは 1,000 です。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum、Maximum、Average |
ThreadpoolSearchRejected |
検索スレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum |
ThreadpoolSearchThreads |
検索スレッドプールのサイズ。 関連するノードの統計: Maximum 関連するクラスターの統計: Average、Sum |
ThreadpoolBulkQueue |
バルクスレッドプールでキューに入っているタスクの数。キューのサイズが一貫して大きい場合は、クラスターのスケーリングを検討してください。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum、Maximum、Average |
ThreadpoolBulkRejected |
バルクスレッドプールで拒否されたタスクの数。この数が増え続ける場合は、クラスターのスケーリングを検討してください。 関連するノードの統計: Maximum 関連するクラスターの統計: Sum |
ThreadpoolBulkThreads |
バルクスレッドプールのサイズ。 関連するノードの統計: Maximum 関連するクラスターの統計: Average、Sum |
ThreadpoolWriteThreads |
書き込みスレッドプールのサイズ。 関連するノードの統計: Maximum 関連するクラスターの統計: Average、Sum |
ThreadpoolWriteRejected |
書き込みスレッドプールで拒否されたタスクの数。 関連するノードの統計: Maximum 関連するクラスターの統計: Average、Sum |
ThreadpoolWriteQueue |
書き込みスレッドプールでキューに入っているタスクの数。 関連するノードの統計: Maximum 関連するクラスターの統計: Average、Sum |
UltraWarm Metrics
Amazon Elasticsearch Service provides the following metrics for UltraWarm nodes.
メトリクス | 説明 |
---|---|
WarmCPUUtilization |
The percentage of CPU usage for UltraWarm nodes in the cluster. Maximum は、CPU 使用率が最も高いノードを示します。Average represents all UltraWarm nodes in the cluster. This metric is also available for individual UltraWarm nodes. 関連する統計: Maximum、Average |
WarmFreeStorageSpace |
The amount of free warm storage space in MiB. Because UltraWarm uses Amazon S3 rather
than attached disks, 関連する統計: Sum |
WarmJVMMemoryPressure |
The maximum percentage of the Java heap used for the UltraWarm nodes. 関連する統計: Maximum |
WarmSearchableDocuments |
クラスター内のすべてのウォームインデックスで検索可能なドキュメントの合計数。正確な値を取得するには、期間を 1 分のままにしておく必要があります。 関連する統計: Sum |
|
The average time, in milliseconds, that it takes a shard on an UltraWarm node to complete a search operation. 関連するノードの統計: Average 関連するクラスターの統計: Average、Maximum |
|
The total number of search requests per minute for all shards on an UltraWarm node.
関連するノードの統計: Average 関連するクラスターの統計: Average、Maximum、Sum |
WarmStorageSpaceUtilization |
クラスターで使用中のウォームストレージスペースの合計容量。The Amazon ES console displays this value in GiB. The Amazon CloudWatch console displays it in MiB. 関連する統計: Max |
|
クラスターで使用しているホットストレージの合計容量。 関連する統計: Max |
WarmSysMemoryUtilization |
使用中のウォームノードのメモリの割合。 関連する統計: Maximum |
|
The number of indices currently waiting to migrate from hot to warm storage. 関連する統計: Maximum |
|
The number of indices currently waiting to migrate from warm to hot storage. 関連する統計: Maximum |
|
The total number of failed hot to warm migrations. 関連する統計: Sum |
|
The average latency of the force merge stage of the migration process. If this stage
consistently takes too long, consider increasing 関連する統計: Average |
|
The average latency of the snapshot stage of the migration process. If this stage consistently takes too long, ensure that your shards are appropriately sized and distributed throughout the cluster. 関連する統計: Average |
|
The average latency of successful hot to warm migrations, not including time spent in the queue. This value is the sum of the amount of time it takes to complete the force merge, snapshot, and shard relocation stages of the migration process. 関連する統計: Average |
|
The total number of successful hot to warm migrations. 関連する統計: Sum |
|
The average latency of successful hot to warm migrations, including time spent in the queue. 関連する統計: Average |
アラートメトリクス
Amazon Elasticsearch Service provides the following metrics for the alerting feature.
メトリクス | 説明 |
---|---|
AlertingDegraded |
値 1 は、アラートインデックスが赤であるか、1 つ以上のノードがスケジュールどおりでないことを意味します。値 0 は正常な動作を示します。 関連する統計: Maximum |
AlertingIndexExists |
値 1 は、 関連する統計: Maximum |
AlertingIndexStatus.green |
インデックスのヘルス。値 1 は、緑を意味します。値 0 は、インデックスが存在しないか、緑ではないことを意味します。 関連する統計: Maximum |
AlertingIndexStatus.red |
インデックスのヘルス。値 1 は、赤を意味します。値 0 は、インデックスが存在しないか、赤でないことを意味します。 関連する統計: Maximum |
AlertingIndexStatus.yellow |
インデックスのヘルス。値 1 は、黄色を意味します。値 0 は、インデックスが存在しないか、黄色でないことを意味します。 関連する統計: Maximum |
AlertingNodesNotOnSchedule |
値 1 は、一部のジョブがスケジュールどおりに実行されていないことを意味します。値 0 は、すべてのアラートジョブがスケジュールどおりに実行されていることを意味します
(またはアラートジョブが存在しないことを意味します)。Amazon ES コンソールを確認するか、 関連する統計: Maximum |
AlertingNodesOnSchedule |
値 1 は、すべてのアラートジョブがスケジュールどおりに実行されていることを意味します (またはアラートジョブが存在しないことを意味します)。値 0 は、一部のジョブがスケジュールどおりに実行されていないことを意味します。 関連する統計: Maximum |
AlertingScheduledJobEnabled |
値 1 は、 関連する統計: Maximum |
異常検出のメトリクス
Amazon Elasticsearch Service provides the following metrics for the anomaly detection feature.
メトリクス | 説明 |
---|---|
AnomalyDetectionPluginUnhealthy |
値 1 は、異常検出プラグインが正しく動作していないことを意味します。これは、障害の数が多いか、使用されているインデックスの 1 つが赤の状態であるためです。値 0 は、プラグインが想定どおりに動作していることを示します。 関連する統計: Maximum |
AnomalyDetectionRequestCount |
異常検出のリクエストの数。 関連する統計: Sum |
AnomalyDetectionFailureCount |
異常検出に失敗したリクエストの数。 関連する統計: Sum |
AnomalyResultsIndexStatusIndexExists |
値 1 は、 関連する統計: Maximum |
AnomalyResultsIndexStatus.red |
値 1 は、 関連する統計: Maximum |
AnomalyDetectorsIndexStatusIndexExists |
値 1 は、 関連する統計: Maximum |
AnomalyDetectorsIndexStatus.red |
値 1 は、 関連する統計: Maximum |
ModelsCheckpointIndexStatusIndexExists |
値 1 は、 関連する統計: Maximum |
ModelsCheckpointIndexStatus.red |
値 1 は、 関連する統計: Maximum |
SQL メトリクス
Amazon Elasticsearch Service provides the following metrics for SQL support.
メトリクス | 説明 |
---|---|
SQLFailedRequestCountByCusErr |
クライアントの問題により失敗した 関連する統計: Sum |
SQLFailedRequestCountBySysErr |
サーバーの問題または機能の制限により失敗した 関連する統計: Sum |
SQLRequestCount |
関連する統計: Sum |
SQLDefaultCursorRequestCount |
関連する統計: Sum |
SQLUnhealthy |
値 1 は、特定のリクエストへのレスポンスで、SQL プラグインが 5xx レスポンスコードを返すか、無効なクエリ DSL を Elasticsearch. に渡すことを示します。他のリクエストは引き続き成功します。値 0 は、最近の障害がないことを示します。値 1 が持続して表示される場合、クライアントがプラグインに対して行っているリクエストのトラブルシューティングを行います。 関連する統計: Maximum |
KNN のメトリクス
Amazon Elasticsearch Service includes metrics for KNN. それぞれの概要については、Open Distro for Elasticsearch のドキュメント
クラスター間検索のメトリクス
Amazon Elasticsearch Service provides the following metrics for Cross-cluster search.
ソースドメインのメトリクス
メトリクス | ディメンション | 説明 |
---|---|---|
CrossClusterOutboundConnections |
|
接続されたノードの数。スキップされたドメインが 1 つ以上レスポンスに含まれている場合は、このメトリクスを使用して異常な接続を追跡します。この数が 0 になった場合、その接続は正常ではありません。 |
CrossClusterOutboundRequests |
|
ターゲットドメインに送信された検索リクエストの数。ドメインでクラスター間検索リクエストが過負荷になっているかどうかを確認し、このメトリクスのスパイクと JVM/CPU スパイクの関連性を探るために使用します。 |
ターゲットドメインのメトリクス
メトリクス | ディメンション | 説明 |
---|---|---|
CrossClusterInboundRequests |
|
ソースドメインから受信した着信接続リクエストの数。 |
Add a CloudWatch alarm in the event that you lose a connection unexpectedly. For steps to create an alarm, see Create a CloudWatch Alarm Based on a Static Threshold.
Learning to Rank Metrics
Amazon Elasticsearch Service provides the following metrics for Learning to Rank.
メトリクス | 説明 |
---|---|
LTRRequestTotalCount |
Total count of ranking requests. |
LTRRequestErrorCount |
Total count of unsuccessful requests. |
LTRStoreIndexIsRed |
Tracks if one of the indices needed to run the plugin is red. |
LTRMemoryUsage |
Total memory used by the plugin. |