ステップスケーリングポリシー - Application Auto Scaling

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ステップスケーリングポリシー

ステップスケーリングポリシーは、 CloudWatch アラームに基づいてあらかじめ定義された単位でアプリケーションの容量をスケーリングします。アラームのしきい値を超えると、スケールアウト (容量の増加) とスケールイン (キャパシティの減少) を処理するスケーリングポリシーを個別に定義できます。

ステップスケーリングポリシーでは、 CloudWatch スケーリングプロセスを呼び出すアラームを作成および管理します。アラームに違反すると、Application Auto Scaling はそのアラームに関連付けられたスケーリングポリシーを開始します。

ステップスケーリングポリシーは、ステップ調整と呼ばれる一連の調整を使用して容量をスケーリングします。調整値の規模は、アラーム違反の大きさに応じて異なります。

  • 違反が最初のしきい値を超えると、Application Auto Scaling は最初のステップ調整を適用します。

  • 違反が 2 番目のしきい値を超えると、Application Auto Scaling は 2 番目のステップ調整を適用するというように続きます。

これにより、スケーリングポリシーは、アラームメトリクスのマイナーな変更とメジャーな変更の両方に適切に対応できます。

ポリシーは、スケーリングアクティビティの進行中も、引き続き別のアラームに対応します。つまり、Application Auto Scaling はアラーム違反が発生するたびに、それらをすべて評価します。複数のアラーム違反が連続して発生することによるオーバースケーリングを防ぐため、クールダウン期間が設けられています。

ターゲットトラッキングと同様に、ステップスケーリングはトラフィックの変化に応じてアプリケーションの容量を自動スケーリングするのに役立ちます。ただし、安定したスケーリングのニーズに対応するには、ターゲット追跡ポリシーの方が実装と管理が容易な傾向があります。

ステップスケーリングポリシーは、以下のスケーラブルなターゲットで使用できます。

  • AppStream 2.0 フリート

  • Aurora DB クラスター

  • ECS サービス

  • EMR クラスター

  • SageMaker エンドポイントバリアント

  • SageMaker 推論コンポーネント

  • SageMaker サーバーレスでプロビジョニングされた同時実行性

  • Spot Fleets

  • カスタムリソース