DAX のモニタリング - Amazon DynamoDB

DAX のモニタリング

モニタリングは、Amazon DynamoDB Accelerator (DAX) および AWS ソリューションの信頼性、可用性、パフォーマンスを維持する上で重要な部分です。マルチポイント障害が発生した場合は、その障害をより簡単にデバッグできるように、AWS ソリューションのすべての部分からモニタリングデータを収集する必要があります。

ただし、DAX のモニタリングを開始する前に、以下の質問に対する回答を反映したモニタリング計画を作成する必要があります。

  • どのような目的でモニタリングしますか?

  • モニタリングの対象となるリソースとは ?

  • どのくらいの頻度でこれらのリソースをモニタリングしますか?

  • 使用するモニタリングツールは?

  • 誰がモニタリングタスクを実行しますか?

  • 問題が発生したときに誰が通知を受け取りますか?

次のステップでは、さまざまなタイミングと負荷条件でパフォーマンスを測定することにより、お客様の環境で通常の DAX のパフォーマンスのベースラインを確定します。DAX をモニタリングするには、モニタリングデータの履歴を保存することを検討します。保存データを、最新のパフォーマンスデータと比較するベースラインとして使用し、通常のパフォーマンスのパターンやパフォーマンスの異常を検出して、問題への対応を検討することができます。

ベースラインを確立するには、最低でも、負荷テスト中と本番稼働環境の両方で次の項目をモニタリングする必要があります。

  • CPU 使用率とスロットル済みのリクエスト。これにより、クラスター内でより大きなノードタイプを使用する必要があるかどうかを判断できます。クラスターの CPU 使用率は、CPUUtilization CloudWatch メトリクスで利用できます。

  • オペレーションのレイテンシー (クライアント側で測定) は、アプリケーションのレイテンシー要件内で一貫して維持する必要があります。

  • ErrorRequestCountFaultRequestCount、および FailedRequestCount CloudWatch メトリクスからわかるように、エラー率は低いままにしておきます。

前述の項目とは別に、少なくとも次の追加項目を本稼働環境でモニタリングする必要があります。

  • データベースの概算サイズおよび削除されたサイズ。これらを使用して、クラスターのノードタイプに、作業セットを処理できる十分なメモリがあるかどうかを判断できます。

  • クライアント接続。これを使用して、クラスターへの接続に原因がわからないスパイクがあるかどうかをモニターできます。