Amazon EC2 Auto Scaling のステップおよび簡易スケーリングポリシー - Amazon EC2 Auto Scaling

Amazon EC2 Auto Scaling のステップおよび簡易スケーリングポリシー

ステップスケーリングおよび簡易スケーリングでは、スケーリングプロセスを呼び出す CloudWatch アラームのスケーリングメトリクスとしきい値を選択します。また、指定した評価期間内にしきい値を超えた場合の Auto Scaling グループのスケーリング方法を定義します。

ターゲット追跡スケーリングポリシーを使用して、Application Load Balancer の平均 CPU 使用率や RequestCountPerTarget メトリクスなどのメトリクスに基づいてスケールすることを強くお勧めします。キャパシティーが増加すると減少し、キャパシティーが減少すると増加するメトリクスを使用すると、ターゲット追跡を使用してインスタンス数を比例的にスケールアウトしたり、インスタンス数を増やすことができます。これにより、Amazon EC2 Auto Scaling がアプリケーションの需要曲線に厳密に従うことが保証されます。詳細については、「ターゲット追跡スケーリングポリシー」を参照してください。

ステップスケーリングポリシーと簡易スケーリングポリシーの違い

ステップスケーリングポリシーと簡易スケーリングポリシーは、使用できる 2 つの動的スケーリングオプションです。どちらの場合も、スケーリングポリシーの CloudWatch アラームを作成する必要があります。両方とも、アラームの上限しきい値および下限しきい値を指定する必要があります。どちらの場合も、インスタンスを追加するか削除するかを定義し、その数を定義するか、またはグループを正確なサイズに設定する必要があります。

ポリシータイプの主な違いは、ステップスケーリングポリシーで得られるステップ調整です。ステップ調整が適用され、Auto Scaling グループの現在のキャパシティーが増減する場合、調整はアラーム違反のサイズによって異なります。

ほとんどの場合、単一のスケーリング調整があっても、簡易スケーリングポリシーよりもステップスケーリングポリシーが適しています。

シンプルなスケーリングの主な問題は、スケーリングアクティビティの開始後、ポリシーが追加のアラームに対応する前に、スケーリングアクティビティまたはヘルスチェック交換が完了し、クールダウン期間が終了するまで待機する必要があるという点です。クールダウンの期間を指定すると、前のアクティビティの効果が表示される前に、追加の規模の拡大や縮小が実行されることを防ぐことができます。

これとは対照的に、ステップスケーリングでは、ポリシーは、スケーリングアクティビティまたはヘルスチェックの置換が進行中であっても、引き続き別のアラームに応答できます。したがってすべてのアラーム超過は、Amazon EC2 Auto Scaling によってアラームメッセージが受信されると評価されます。

Amazon EC2 Auto Scaling は元々、簡易スケーリングポリシーのみをサポートしていました。ターゲットの追跡およびステップポリシーの導入前にスケーリングポリシーを作成した場合、そのポリシーは簡易スケーリングポリシーとして扱われます。

ステップスケーリングのステップ調整

ステップスケーリングポリシーを作成するときは、アラーム超過のサイズに基づいてインスタンス数を動的にスケーリングする 1 つ以上のステップ調整値を指定します。各ステップ調整値は、次のように指定します。

  • メトリクス値の下限

  • メトリクス値の上限

  • スケーリング調整タイプに基づいてスケールする量

CloudWatch は、CloudWatch アラームに関連付けられたメトリクスの統計に基づいて、メトリクスデータポイントを集計します。アラームに違反すると、適切なスケーリングポリシーが呼び出されます。Amazon EC2 Auto Scaling は、(Raw メトリクスデータではなく) CloudWatch からの最新のメトリックデータポイントに集約タイプを適用します。ステップ調整によって定義された上限と下限に対して、この集約メトリクス値を比較することにより、実行するステップ調整が決定されます。

違反しきい値に比例して上限と下限を指定します。例えば、現在のキャパシティーと希望するキャパシティーが 10 の Auto Scaling グループがあるとします。メトリクスの上限とメトリクスの下限のしきい値がそれぞれ 60% と 40% の CloudWatch アラーム、およびスケールアウトポリシーとスケールインポリシーがあります。各ポリシーに対して、調整タイプ PercentChangeInCapacity (またはコンソールの [Percent of group (グループの割合)]) を持つ一連のステップ調整があります。

例: スケールアウトポリシーのステップ調整値
下限 上限 調整

0

10

0

10

20

10

20

null

30

例: スケールインポリシーのステップ調整値
下限 上限 調整

-10

0

0

-20

-10

-10

null

-20

-30

これにより、次のスケーリング設定が作成されます。

Metric value -infinity 30% 40% 60% 70% infinity ----------------------------------------------------------------------- -30% | -10% | Unchanged | +10% | +30% -----------------------------------------------------------------------

以下の点は、グループの希望キャパシティーと現在のキャパシティーに関連してスケーリング設定の動作をまとめたものです。

  • 集合メトリクス値が 40 より大きく 60 未満である間は、現在のキャパシティーと必要なキャパシティーが維持されます。

  • メトリクス値が 60 になった場合、スケールアウトのポリシーの 2 番目のステップ調整値 (10 インスタンスの 10% を追加) に基づいて、グループの必要なキャパシティーを 1 インスタンスだけ増やして、11 インスタンスにします。新しいインスタンスが実行され、その指定されたウォームアップ期間が終了した後、グループの現在のキャパシティーを 11 インスタンスに増やします。このキャパシティーの増加後も、メトリクス値が 70 に上昇すると、グループの希望するキャパシティーはさらに 3 インスタンス増加し、14 インスタンスになります。これは、スケールアウトポリシーの 3 番目のステップ調整に基づきます (11 インスタンスの 30% である 3.3 インスタンスを 3 インスタンスに切り捨て、追加します)。

  • メトリクス値が 40 になった場合、スケールインポリシーの 2 番目のステップ調整値 (14 インスタンスの 10%、つまり 1.4 インスタンスを丸めた 1 インスタンスを削除) に基づいて、グループの必要なキャパシティーを 1 インスタンスだけ減らして、13 インスタンスにします。このキャパシティーが減少した後も、メトリクス値が 30 に下がると、グループの希望するキャパシティーはさらに 3 インスタンス減少し、10 インスタンスになります。これは、スケールインポリシーの 3 番目のステップ調整に基づきます (13 インスタンスの 30% である 3.9 インスタンスを 3 インスタンスに切り捨て、減算します)。

スケーリングポリシーのステップ調整を指定するときは、次の点に注意してください。

  • AWS Management Console を使用している場合は、絶対値として上限と下限を指定します。AWS CLI または SDK を使用している場合は、違反しきい値と相対的に上限と下限を指定します。

  • ステップ調整値の範囲に重複や間隔があってはなりません。

  • 1 つのステップ調整値のみ、下限を null (負の無限大) にすることができます。下限が負のステップ調整値がある場合は、下限が null のステップ調整値が必要です。

  • 1 つのステップ調整値のみ、上限を null (正の無限大) にすることができます。上限が正のステップ調整値がある場合は、上限が null のステップ調整値が必要です。

  • 同じステップ調整値で上限と下限を null にすることはできません。

  • メトリクス値が超過しきい値を上回っている場合、下限にその値を含み、上限には含みません。メトリクス値が超過しきい値を下回っている場合、下限にその値を含まず、上限に含みます。

スケーリング調整タイプ

選択したスケーリング調整タイプに基づいて、最適なスケーリングアクションを実行するスケーリングポリシーを定義できます。調整タイプは、Auto Scaling グループの現在のキャパシティーに対する割合、またはキャパシティーユニットで指定できます。通常、キャパシティーユニットは、インスタンスの重み付け機能を使用していない限り、1 つのインスタンスを意味します。

Amazon EC2 Auto Scaling は、ステップスケーリングと簡易スケーリングに対して次の調整タイプをサポートしています。

  • ChangeInCapacity - 指定した値だけ現在のキャパシティーを増減させます。正の調整値は現在のキャパシティーを増やし、負の調整値は現在のキャパシティーを減らします。例えば、グループの現在のキャパシティーが 3 で、調整値が 5 の場合、このポリシーが実行されると、キャパシティーユニットが 5 個キャパシティーに追加され、合計 8 個のキャパシティーユニットになります。

  • ExactCapacity - グループの現在のキャパシティーを指定された値に変更します。この調整タイプには負ではない値を指定します。例えば、グループの現在のキャパシティーが 3 で、調整値が 5 の場合、このポリシーが実行されると、キャパシティーは 5 キャパシティーユニットに変更されます。

  • PercentChangeInCapacity - 指定したパーセンテージだけ現在のキャパシティーを増減させます。正の値はキャパシティーを増やし、負の値はキャパシティーを減らします。例えば、現在のキャパシティーが 10 で、調整値が 10% の場合、このポリシーが実行されると、キャパシティーユニットが 1 個追加され、合計 11 個のキャパシティーユニットになります。

    注記

    結果の値が整数でない場合、その値を以下のように四捨五入します。

    • 1 より大きい値は小数点以下が切り捨てられます。例えば、12.712 に丸められます。

    • 0 と 1 の間の値は 1 に丸められます。例えば、.671 に丸められます。

    • 0 と -1 の間の値は -1 に丸められます。例えば、-.58-1 に丸められます。

    • -1 未満の値は小数点以下が切り捨てられます。例えば、-6.67-6 に丸められます。

PercentChangeInCapacity では、MinAdjustmentMagnitude パラメータを使用して、スケールするインスタンスの最小数を指定することもできます。例えば、25 パーセント追加するポリシーを作成し、インスタンスの最小増減値を 2 に指定するとします。4 つのインスタンスを持つ Auto Scaling グループがあり、スケーリングポリシーを実行する場合、25 パーセントは 1 インスタンスです。ただし、最小増減値が 2 に指定されているため、2 つのインスタンスが追加されます。

インスタンスの重み付けを使用すると、MinAdjustmentMagnitude パラメータをゼロ以外の値に設定した効果が変化します。値はキャパシティーユニットで指定します。スケールするインスタンスの最小数を設定するには、このパラメータを、最大インスタンスの重みと同じ以上の値に設定します。

インスタンスの重み付けを使用している場合、Auto Scaling グループの現在のキャパシティーは、必要に応じて希望するキャパシティーを超える場合があることに注意してください。デクリメントする絶対数、またはデクリメントする割合が現在のキャパシティーと希望するキャパシティーの差よりも小さい場合、スケーリングアクションは実行されません。しきい値アラームに違反している場合にスケーリングポリシーの結果を確認する際は、このような動作を考慮に入れる必要があります。例えば、希望するキャパシティーが 30 で、現在のキャパシティーが 32 であるとします。アラームに違反している場合、スケーリングポリシーで希望するキャパシティーを 1 ずつ減らすと、スケーリングアクションは実行されません。

インスタンスのウォームアップ

ステップスケーリングの場合、オプションで、新しく起動されたインスタンスのウォームアップ時間を秒単位で指定できます。指定されたウォームアップ期間が終了するまで、インスタンスは Auto Scaling グループの集約された EC2 インスタンスメトリクスにカウントされません。

インスタンスのウォームアップ期間中、スケーリングポリシーは、ウォームアップしていないインスタンスからのメトリクス値がポリシーのアラーム上限しきい値を超える場合にのみスケールアウトします。

グループが再度スケールアウトする場合、まだウォームアップ中のインスタンスは、次のスケールアウトアクティビティの希望キャパシティーの一部として計上されます。したがって、複数のアラーム超過によってもステップ調整値の範囲は変わらず、1 つのスケーリングアクティビティという結果になります。その目的は、スケールアウトを継続的に (ただし過剰になることなく) 行うことです。

例えば、2 つのステップからなるポリシーを作成するとします。最初のステップでは、メトリクスが 60 になったら 10% を追加し、2 番目のステップではメトリクスが 70 になったら 30% を追加します。Auto Scaling グループの目的キャパシティーは 10 で、現在のキャパシティは 10 です。集約されたメトリクス値が 60 未満の間は、目的キャパシティーと現在のキャパシティーは変わりません。メトリクスが 60 になり、1 つのインスタンス (10 インスタンスの 10 パーセント) が追加されたとします。その後、新しいインスタンスがまだウォームアップしている間に、メトリクスは 62 になります。スケーリングポリシーは、現在のキャパシティー (まだ 10) に基づいて新しく必要なキャパシティーを計算します。ただし、グループの必要キャパシティーはすでに 11 インスタンスに増えているため、スケーリングポリシーはこれ以上必要キャパシティーは増やしません。新しいインスタンスがまだウォームアップ中にメトリックスが 70 になった場合は、3 インスタンス (10 インスタンスの 30%) を追加する必要があります。ただし、グループの必要なキャパシティーはすでに 11 であるため、2 つのインスタンスのみを追加し、新しい必要なキャパシティーは 13 インスタンスになります。

スケールアウトアクティビティの進行中は、インスタンスがウォームアップを終了するまで、スケーリングポリシーによって開始されたすべてのスケールインアクティビティがブロックされます。インスタンスのウォームアップが完了し、スケールインイベントが発生した場合、現在終了中のインスタンスは、新しい必要キャパシティーを計算する際にグループの現在のキャパシティーにカウントされます。したがって、Auto Scaling グループから必要以上の数のインスタンスが削除されることがなくなります。例えば、インスタンスがすでに終了しているときに、必要なキャパシティーを 1 つデクリメントした同じステップ調整の範囲内でアラームに違反した場合、スケーリングアクションは実行されません。

デフォルト値

値が設定されていない場合、スケーリングポリシーは、グループに定義されているデフォルトのインスタンスウォームアップの値であるデフォルト値を使用します。インスタンスのデフォルトウォームアップが null の場合、デフォルトクールダウンの値にフォールバックします。ウォームアップ時間が変更されたときにすべてのスケーリングポリシーを簡単に更新できるように、デフォルトのインスタンスウォームアップを使用することをお勧めします。詳細については、「Auto Scaling グループに対するインスタンスのデフォルトウォームアップを設定する」を参照してください。

考慮事項

ステップおよびシンプルなスケーリングポリシーを使用する場合は、次の考慮事項が適用されます。

  • ステップスケーリングを使用できるほど正確にアプリケーションのステップ調整を予測できるかどうかを検討してください。スケーリングメトリクスがスケーラブルターゲットの容量に比例して増減する場合は、代わりにターゲット追跡スケーリングポリシーを使用することをお勧めします。より高度な設定には、追加ポリシーとしてステップスケーリングを使用するオプションがあります。例えば、必要に応じて、使用率が一定のレベルに達したときにより積極的なレスポンスを設定できます。

  • フラッピングを防ぐために、スケールアウトとスケールインのしきい値の間には適切なマージンを選択してください。フラッピングは、スケールインとスケールアウトの無限ループです。つまり、スケーリングアクションが実行されると、メトリクス値が変化して、逆方向に別のスケーリングアクションが開始されます。

メトリクスの上限しきい値および下限しきい値の CloudWatch アラームを作成する (コンソール)

CloudWatch コンソールを使用して、スケールアウト (メトリクス高) 用とスケールイン (メトリクス低) 用の 2 つの CloudWatch アラームを作成できます。例えば、トラフィックが増加してアラームのしきい値を超えると、アラームは ALARM 状態に遷移します。この状態の変化により、アラームに関連付けられたスケーリングポリシーが呼び出されます。その後、ポリシーによって、指定した数のインスタンスの追加または削除など、アラーム違反に対応する方法が Amazon EC2 Auto Scaling に指示されます。

例: メトリクスの上限しきい値の CloudWatch アラームを作成するには
  1. https://console.aws.amazon.com/cloudwatch/ で CloudWatch コンソールを開きます。

  2. 必要に応じて、リージョンを変更します。ナビゲーションバーから、Auto Scaling グループがあるリージョンを選択します。

  3. ナビゲーションペインで、[Alarms]、[All alarms] (アラーム、すべてのアラーム) の順に選択してから、[Create alarm] (アラームの作成) を選択します。

  4. [Select metric] (メトリクスの選択) を選択します。

  5. [All metrics (すべてのメトリクス)] タブで、[EC2]、[By Auto Scaling Group (Auto Scaling グループ別)] を選択し、検索フィールドに Auto Scaling グループの名前を入力します。次に、CPUUtilization を選択し、[メトリクスの選択] を選択します。[Specify metric and conditions] ページに、メトリクスに関するグラフや他の情報が表示されます。

  6. [期間] でアラームの評価期間 (1 分など) を選択します。アラームを評価する場合、各期間は 1 つのデータポイントに集約されます。

    注記

    期間が短いほど、作成されるアラームの感度が高くなります。

  7. [条件] で、次の操作を行います。

    • [Threshold type] で [静的] を選択します。

    • [CPUUtilization が次の時] の場合、アラーム違反のしきい値に対するメトリクスの値を [より高い]、[以上]、[より低い]、[以下] のいずれかに指定します。次に、[than] (次よりも:) にアラーム違反のしきい値を入力します。

      重要

      スケールアウトポリシー (メトリクス高) で使用するアラームについては、しきい値に対して [less than] (次未満:)、または [less than or equal to] (次以下:) を選択しないようにします。スケールインポリシー (メトリクス低) で使用するアラームについては、しきい値に対して [greater than] (次より大きい:)、または [greater than or equal to] (次以上:) を選択しないようにします。

  8. [追加設定] で、次の操作を行います。

    • [Datapoints to alarm] (アラームへのデータポイント)に、メトリクス値がしきい値を満たす必要があるデータポイント数 (評価期間) を入力します。例えば、5 分の期間が 2 回連続すると、アラームの状態が呼び出されるまで 10 分かかります。

    • [Missing data treatment (欠落データの処理)] では、[Treat missing data as bad (breaching threshold) (欠落データを問題として処理する (しきい値を超過))] を選択します。詳細については、Amazon CloudWatch ユーザーガイドの「CloudWatch アラームが欠落データを処理する方法の設定」を参照してください。

  9. [Next] (次へ) をクリックします。

    [Configure actions] (アクションの設定) ページが表示されます。

  10. [通知] で、アラームが ALARM 状態、OK 状態、または INSUFFICIENT_DATA 状態のときに通知するための Amazon SNS トピックを選択します。

    同じアラーム状態または複数の異なるアラーム状態について複数の通知を送信するには、[Add notification (通知の追加)] を選択します。

    アラームの通知を送信しない場合は、 [削除] を選択します。

  11. Configure actions (アクションの設定) ページの他のセクションは空にしたままにすることができます。他のセクションを空のままにすると、スケーリングポリシーへの関連付けなしでアラームが作成されます。その後、Amazon EC2 Auto Scaling コンソールから、アラームをスケーリングポリシーに関連付けることができます。

  12. [Next] (次へ) をクリックします。

  13. 名前 (Step-Scaling-AlarmHigh-AddCapacity など) を入力し、必要に応じてアラームの説明を入力して [次へ] を選択します。

  14. [アラームの作成] を選択します。

例: CPU が 80% のしきい値を 4 分間超過した場合に違反する CloudWatch アラーム


                        CloudWatch アラーム

ステップスケーリングポリシーの作成 (コンソール)

グループの作成後、Auto Scaling グループにステップスケーリングポリシーを設定できます。

次の手順は、2 つのステップスケーリングポリシーを作成するために Amazon EC2 Auto Scaling コンソールを使用する方法を示します。スケールアウトポリシーはグループのキャパシティーを 30 パーセント増やし、スケールインポリシーはグループのキャパシティーを 2 インスタンスに減らす方法を示しています。

スケーリングポリシーを設定している間、アラームを同時に作成できます。または、前のセクションで説明したように、CloudWatch コンソールから作成したアラームを使用することもできます。

スケールアウト用のステップスケーリングポリシーを作成するには
  1. https://console.aws.amazon.com/ec2/ でAmazon EC2 コンソールを開き、ナビゲーションペインで [Auto Scaling グループ] を選択します。

  2. Auto Scaling グループの横にあるチェックボックスを選択します。

    ページの下部にスプリットペインが開きます。

  3. 最小および最大サイズの制限が適切に設定されていることを確認します。例えば、グループがすでにその最大サイズに達している場合は、スケールアウトするために新しい最大サイズを指定する必要があります。Amazon EC2 Auto Scaling は、最小キャパシティー以下または最大キャパシティー以上にグループがスケールされることはありません。グループを更新するには、[詳細] タブで、最小キャパシティーと最大キャパシティーの現在の設定を変更します。

  4. [Automatic scaling] (オートスケーリング) タブの [Dynamic scaling policies] (動的スケーリングポリシー) で、[Create dynamic scaling] (動的スケーリングポリシーの作成) を選択します。

  5. スケールアウト (キャパシティーを増やす) のポリシーを定義するには、次の手順を実行します。

    1. [Policy type (ポリシータイプ)] で、[Step scaling (ステップスケーリング)] を選択します。

    2. ポリシーの名前を指定します。

    3. [CloudWatch アラーム] でアラームを選択します。アラームをまだ作成していない場合は、[Create a CloudWatch alarm] (CloudWatch アラームを作成する) を選択し、メトリクスの上限しきい値および下限しきい値の CloudWatch アラームを作成する (コンソール) でステップ 4 からステップ 14 を実行して、CPU 使用率を監視するアラームを作成します。アラームのしきい値を 80% 以上に設定します。

    4. [Take the action (このアクションを実行)] を使用して、このポリシーの実行時に行う現在のグループサイズの変更を指定します。特定の数のインスタンスまたは既存のグループサイズに対する割合を追加したり、グループを正確なサイズに設定したりできます。

      たとえば、Add を選択し、次のフィールドに 30 と入力してから percent of group を選択します。デフォルトでは、このステップ調整値の下限はアラームしきい値であり、上限は正 (+) の無限大です。

    5. 別のステップを追加するには、[Add step (ステップの追加)] を選択し、スケールする量と、アラームしきい値に対するステップの下限と上限を定義します。

    6. 最小数のインスタンスを設定してスケールするには、[Add capacity units in increments of at least (最小数の増分でキャパシティーユニットを追加する)] 1 [capacity units (キャパシティーユニット)] の数値フィールドをアップデートします。

    7. (オプション) [Instances need] (インスタンスには以下のものが必要です) で、必要に応じてインスタンスのウォームアップ値を更新します。

  6. [Create] (作成) を選択します。

スケールイン用のステップスケーリングポリシーを作成するには
  1. [Create dynamic scaling policy (動的スケーリングポリシーの作成)] を選択して、スケールアウトのポリシーを作成した後で中断したところを続行します。

  2. スケールイン (キャパシティーの減少) のポリシーを定義するには、次の手順を実行します。

    1. [Policy type (ポリシータイプ)] で、[Step scaling (ステップスケーリング)] を選択します。

    2. ポリシーの名前を指定します。

    3. [CloudWatch アラーム] でアラームを選択します。アラームをまだ作成していない場合は、[Create a CloudWatch alarm] (CloudWatch アラームを作成する) を選択し、メトリクスの上限しきい値および下限しきい値の CloudWatch アラームを作成する (コンソール) でステップ 4 からステップ 14 を実行して、CPU 使用率を監視するアラームを作成します。アラームのしきい値を 40% 以下に設定します。

    4. [Take the action (このアクションを実行)] を使用して、このポリシーの実行時に行う現在のグループサイズの変更を指定します。特定の数のインスタンスまたは既存のグループサイズに対する割合を削除したり、グループを正確なサイズに設定したりできます。

      たとえば、Remove を選択し、次のフィールドに 2 と入力してから capacity units を選択します。デフォルトでは、このステップ調整値の上限はアラームしきい値であり、下限は負 (-) の無限大です。

    5. 別のステップを追加するには、[Add step (ステップの追加)] を選択し、スケールする量と、アラームしきい値に対するステップの下限と上限を定義します。

  3. [Create] (作成) を選択します。

スケーリングポリシーと CloudWatch アラームの作成 (AWS CLI)

以下のように AWS CLI を使用して Auto Scaling グループのステップまたは簡易スケーリングポリシーを設定します。

ステップ 1: [Auto Scaling グループ] を作成します。

以下の create-auto-scaling-group コマンドを使用して、起動テンプレート my-template を使用して my-asg という名前の Auto Scaling グループを作成します。起動テンプレートがない場合は、「AWS CLI 起動テンプレートの使用例」を参照してください。

aws autoscaling create-auto-scaling-group --auto-scaling-group-name my-asg \ --launch-template LaunchTemplateName=my-template,Version='2' \ --vpc-zone-identifier "subnet-5ea0c127,subnet-6194ea3b,subnet-c934b782" \ --max-size 5 --min-size 1

ステップ 2: スケーリングポリシーを作成する

アプリケーションの負荷が変化したときの処理を Auto Scaling グループに指示する、ステップまたは簡易スケーリングポリシーを作成できます。

ステップスケーリングポリシー

例: my-step-scale-out-policy

以下の put-scaling-policy コマンドを使用して、PercentChangeInCapacity の調整タイプで my-step-scale-out-policy という名前のステップスケーリングポリシーを作成します。このポリシーでは、以下のステップ調整に基づいてグループのキャパシティーを増やします (CloudWatch アラームしきい値を 60% と想定)。

  • メトリクスの値が 60% 以上、75% 未満の場合は、インスタンス数を 10% 増やします。

  • メトリクスの値が 75% 以上、85% 未満の場合は、インスタンス数を 20% 増やします。

  • メトリクスの値が 85% 以上の場合は、インスタンス数を 30% 増やします。

aws autoscaling put-scaling-policy \ --auto-scaling-group-name my-asg \ --policy-name my-step-scale-out-policy \ --policy-type StepScaling \ --adjustment-type PercentChangeInCapacity \ --metric-aggregation-type Average \ --step-adjustments MetricIntervalLowerBound=0.0,MetricIntervalUpperBound=15.0,ScalingAdjustment=10 \ MetricIntervalLowerBound=15.0,MetricIntervalUpperBound=25.0,ScalingAdjustment=20 \ MetricIntervalLowerBound=25.0,ScalingAdjustment=30 \ --min-adjustment-magnitude 1

ポリシーの Amazon リソースネーム (ARN) を記録します。ポリシーの CloudWatch アラームを作成する場合に必要です。

{ "PolicyARN": "arn:aws:autoscaling:region:123456789012:scalingPolicy:4ee9e543-86b5-4121-b53b-aa4c23b5bbcc:autoScalingGroupName/my-asg:policyName/my-step-scale-in-policy }
例: my-step-scale-in-policy

以下の put-scaling-policy コマンドを使用して my-step-scale-in-policy という名前のステップスケーリングポリシーを作成し、関連する CloudWatch アラームがメトリクスのしきい値の下限を超えた場合に、調整タイプ ChangeInCapacity を使用して 2 つのインスタンスでグループのキャパシティーを減らします。

aws autoscaling put-scaling-policy \ --auto-scaling-group-name my-asg \ --policy-name my-step-scale-in-policy \ --policy-type StepScaling \ --adjustment-type ChangeInCapacity \ --step-adjustments MetricIntervalUpperBound=0.0,ScalingAdjustment=-2

ポリシーの Amazon リソースネーム (ARN) を記録します。これは、ポリシーの CloudWatch アラームを作成する場合に必要です。

{ "PolicyARN": "arn:aws:autoscaling:region:123456789012:scalingPolicy:ac542982-cbeb-4294-891c-a5a941dfa787:autoScalingGroupName/my-asg:policyName/my-step-scale-out-policy }

簡易スケーリングポリシー

あるいは、先ほどの CLI コマンドの代わりに以下の CLI コマンドを使用して、簡易スケーリングポリシーを作成できます。簡易スケーリングポリシーを使用しているため、クールダウン期間が設定されることに注意してください。

例: my-simple-scale-out-policy

以下の put-scaling-policy コマンドを使用して my-simple-scale-out-policy という名前の簡易スケーリングポリシーを作成し、関連する CloudWatch アラームがメトリクスのしきい値の上限を超えた場合に、調整タイプ PercentChangeInCapacity を使用してグループのキャパシティーを 30% 増やします。

aws autoscaling put-scaling-policy --policy-name my-simple-scale-out-policy \ --auto-scaling-group-name my-asg --scaling-adjustment 30 \ --adjustment-type PercentChangeInCapacity

ポリシーの Amazon リソースネーム (ARN) を記録します。これは、ポリシーの CloudWatch アラームを作成する場合に必要です。

例: my-simple-scale-in-policy

以下の put-scaling-policy コマンドを使用して my-simple-scale-in-policy という名前の簡易スケーリングポリシーを作成し、関連する CloudWatch アラームがメトリクスのしきい値の下限を超えた場合に、調整タイプ ChangeInCapacity を使用してグループのキャパシティーを 1 インスタンス減らします。

aws autoscaling put-scaling-policy --policy-name my-simple-scale-in-policy \ --auto-scaling-group-name my-asg --scaling-adjustment -1 \ --adjustment-type ChangeInCapacity --cooldown 180

ポリシーの Amazon リソースネーム (ARN) を記録します。これは、ポリシーの CloudWatch アラームを作成する場合に必要です。

ステップ 3: メトリクスの上限しきい値および下限しきい値の CloudWatch アラームを作成する

ステップ 2 では、メトリクス値が増減している場合に、スケールアウトおよびスケールインする方法を Amazon EC2 Auto Scaling に指示するスケーリングポリシーを作成しました。このステップでは、監視するメトリクスを識別し、アラームのメトリクスの上限しきい値と下限しきい値、およびその他の詳細を定義し、アラームをスケーリングポリシーに関連付けることで 2 つのアラームを作成します。

例: AddCapacity

以下の CloudWatch put-metric-alarm コマンドを使用して、2 分間の連続した 2 つの評価期間にわたって平均 CPU しきい値 60% に基づいて Auto Scaling グループのサイズを増やすアラームを作成します。独自のカスタムメトリクスを使用するには、名前を --metric-name で指定し、その名前空間を --namespace で指定します。

aws cloudwatch put-metric-alarm --alarm-name Step-Scaling-AlarmHigh-AddCapacity \ --metric-name CPUUtilization --namespace AWS/EC2 --statistic Average \ --period 120 --evaluation-periods 2 --threshold 60 \ --comparison-operator GreaterThanOrEqualToThreshold \ --dimensions "Name=AutoScalingGroupName,Value=my-asg" \ --alarm-actions PolicyARN
例: RemoveCapacity

以下の CloudWatch put-metric-alarm コマンドを使用して、2 分間の連続した 2 つの評価期間にわたって平均 CPU しきい値 40% に基づいて Auto Scaling グループのサイズを減らすアラームを作成します。独自のカスタムメトリクスを使用するには、名前を --metric-name で指定し、その名前空間を --namespace で指定します。

aws cloudwatch put-metric-alarm --alarm-name Step-Scaling-AlarmLow-RemoveCapacity \ --metric-name CPUUtilization --namespace AWS/EC2 --statistic Average \ --period 120 --evaluation-periods 2 --threshold 40 \ --comparison-operator LessThanOrEqualToThreshold \ --dimensions "Name=AutoScalingGroupName,Value=my-asg" \ --alarm-actions PolicyARN