メニュー
Amazon Elasticsearch Service
開発者ガイド (API バージョン 2015-01-01)

推奨 CloudWatch アラーム

CloudWatch アラームは、CloudWatch メトリックスがある程度の時間にわたって指定された値を超えたときにアクションを実行します。たとえば、クラスターの状態が red になって 1 分を超えたときに AWS から E メールを受け取ることができます。このセクションでは、いくつかの推奨されるアラームとそのアラームへの対応方法について説明します。

アラームの設定に関する詳細については、Amazon CloudWatch ユーザーガイド の「Amazon CloudWatch アラームの作成」を参照してください。

アラーム 問題
ClusterStatus.red maximum is >= 1 for 1 minute, 1 consecutive time 少なくとも 1 つのプライマリシャードとそのレプリカがノードに割り当てられていません。「赤のクラスター状態」を参照してください。
ClusterStatus.yellow maximum is >= 1 for 1 minute, 1 consecutive time 少なくとも 1 つのレプリカシャードがノードに割り当てられていません。「黄色のクラスター状態」を参照してください。
FreeStorageSpace minimum is <= 20000 for 1 minute, 1 consecutive time クラスターのノードの空きストレージ容量が 20 GB に下がっています。「使用可能なストレージ領域の不足」を参照してください。この値は MB 単位です。20000 ではなく、各ノードのストレージ容量の 25% に設定することをお勧めします。
ClusterIndexWritesBlocked is >= 1 for 5 minutes, 1 consecutive time クラスターは書き込みリクエストをブロックしています。「ClusterBlockException」を参照してください。
Nodes minimum is < x for 1 day, 1 consecutive time x はクラスター内のノード数です。このアラームは、クラスター内の少なくとも 1 つのノードが 1 日間にわたってアクセスできない状態を意味します。「障害が発生したクラスターノード」を参照してください。
AutomatedSnapshotFailure maximum is >= 1 for 1 minute, 1 consecutive time 自動スナップショットが失敗しました。多くの場合、この失敗によってクラスター状態が赤になります。「赤のクラスター状態」を参照してください。

すべての自動スナップショットの概要および障害に関する情報を取得するには、次の操作を試してください。

GET domain_endpoint/_snapshot/cs-automated/_all
CPUUtilization average is >= 80% for 15 minutes, 3 consecutive times 100% の CPU 使用率は珍しくありませんが、高い平均値が持続する場合は問題があります。より大規模なインスタンスタイプを使用するか、インスタンスを追加することを検討してください。
JVMMemoryPressure maximum is >= 80% for 15 minutes, 1 consecutive time 使用量が増加した場合にクラスターでメモリ不足エラーが発生する可能性があります。垂直スケーリングを検討してください。Amazon ES では Java ヒープ (最大 32 GB のヒープサイズまで) にインスタンスの RAM の半分を使用します。インスタンスは最大 64 GB の RAM まで垂直スケーリングでき、それ以上はインスタンスを追加することで水平方向にスケーリングできます。
MasterCPUUtilization average is >= 50% for 15 minutes, 3 consecutive times より大規模なインスタンスタイプを専用マスターノードとして使用することを検討してください。クラスターの安定性と Blue/Green デプロイに関わるため、専用マスターノードの CPU の平均使用率はデータノードよりも低くする必要があります。
MasterJVMMemoryPressure is >= 80% for 15 minutes, 1 consecutive time
KMSKeyError is >= 1 for 1 minute, 1 consecutive time ドメインに保存されているデータを暗号化する KMS 暗号化キーが無効になっています。通常のオペレーションを復元するために、再度有効にしてください。詳細については、「Amazon Elasticsearch Service の保管時のデータの暗号化」を参照してください。
KMSKeyInaccessible is >= 1 for 1 minute, 1 consecutive time ドメインに保存されているデータを暗号化する KMS 暗号化キーが削除されたか、Amazon ES への権限が取り消されています。この状態のドメインを復旧することはできませんが、手動スナップショットがある場合は、それを使用して新しいドメインに移行できます。詳細については、「Amazon Elasticsearch Service の保管時のデータの暗号化」を参照してください。

注記

メトリックスを表示するのみであれば、「CloudWatch メトリックスのモニタリング」を参照してください。