OPS08-BP07 ワークロードの異常が検出された場合に警告する
ワークロードの異常が検出された場合、必要に応じて適切な対応ができるよう、アラートを発生させます。
時間をかけてワークロードメトリクスを分析すると、イベントを定義したり、それに応じてアラームを発生させるために十分に定量化できる行動パターンが確立されることがあります。
トレーニングが完了すると、 CloudWatch Anomaly Detection 機能を使用して、 検出された異常を警告したり、 メトリクスデータのグラフに重ねて 予想値を渡して 継続的な比較を行うことができます。
一般的なアンチパターン:
-
小売業のウェブサイトの売上が急激かつ劇的に増加しました。誰も気づいていません。誰もこの急増の原因を特定しようとしていません。負荷が増える中で、質の高いカスタマーエクスペリエンスを確保するための措置を講じている人はいません。
-
パッチの適用後、永続的なサーバーが頻繁に再起動し、ユーザーの操作を中断します。サーバーは通常、最大 3 回まで再起動しますが、それを超えては再起動しません。誰も気づいていません。これが生じている理由を誰も特定しようとしていません。
このベストプラクティスを活用するメリット: ワークロードの動作パターンを理解することで、予期しない動作を特定し、必要に応じてアクションを実行できます。
このベストプラクティスを活用しない場合のリスクレベル: 低
実装のガイダンス
-
ワークロードの異常が検出された場合にアラートを出す: ワークロードの異常が検出された場合、必要に応じて適切な対応ができるよう、アラートを発生させます。
リソース
関連するドキュメント: