翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon EC2 Auto Scaling の動的スケーリング
動的スケーリングは、トラフィックの変化に応じて Auto Scaling グループのキャパシティをスケールします。
Amazon EC2 Auto Scaling は、次のタイプの動的スケーリングポリシーをサポートしています。
-
ターゲット追跡スケーリング - Amazon CloudWatch メトリクスとターゲット値に基づいて、グループの現在の容量を増減します。これはサーモスタットで家の温度を管理する方法と似ています (温度を選択すれば、後はサーモスタットがすべてを実行します)。
-
ステップスケーリング - アラーム違反の規模に応じて変動する一連のスケーリング調整値 (ステップ調整値) に基づいて、グループの現在のキャパシティを増減させます。
-
シンプルなスケーリング - 1 つのスケーリング調整値に基づいて、各スケーリングアクティビティ間のクールダウン期間により、グループの現在のキャパシティを増減させます。
ターゲット追跡スケーリングポリシーを使用し、Auto Scaling グループのキャパシティの変化に反比例して変化するメトリクスを選択することを強くお勧めします。つまり、Auto Scaling グループのサイズを 2 倍にすると、メトリクスが 50% 減少するようにします。これにより、メトリクスデータが比例スケーリングイベントを正確にトリガーできます。ターゲットあたりの平均 CPU 使用率や平均リクエスト数などのメトリクスが含まれます。
ターゲット追跡により、Auto Scaling グループは、アプリケーションの実際の負荷に正比例してスケールします。つまり、ターゲット追跡ポリシーは、負荷の変化に対応するキャパシティの緊急のニーズを満たすだけでなく、季節変動などにより経時的に発生する負荷の変化にも対応できます。
ターゲット追跡ポリシーでは、 CloudWatch アラームとスケーリング調整を手動で定義する必要もなくなります。Amazon EC2 Auto Scaling は、設定したターゲットに基づいてこれを自動的に処理します。
内容
- 動的スケーリングポリシーが機能する方法
- 複数の動的スケーリングポリシー
- Amazon EC2 Auto Scaling のターゲット追跡スケーリングポリシー
- Amazon EC2 Auto Scaling のステップおよびシンプルなスケーリングポリシー
- Amazon EC2 Auto Scaling のスケーリングのクールダウン
- Amazon SQS に基づくポリシーのスケーリング
- Auto Scaling グループのスケーリングアクティビティを検証する
- Auto Scaling グループのスケーリングポリシーを無効化する
- Auto Scaling グループのスケーリングポリシーを削除する
- AWS CLIのスケーリングポリシーの例
動的スケーリングポリシーが機能する方法
動的スケーリングポリシーは、特定の EC2 メトリクスを追跡するように Amazon CloudWatch Auto Scaling に指示し、関連付けられた CloudWatch アラームが ALARM にあるときに実行するアクションを定義します。アラームの状態の呼び出しに使用されるメトリクスは、Auto Scaling グループのすべてのインスタンスから取得されるメトリクスの集約です。(例えば、1 つのインスタンスが 60% CPU で、もう 1 つのインスタンスが 40% CPU である 2 つのインスタンスを持つ Auto Scaling グループがあるとします。 平均して、50% のCPUです)。ポリシーが有効になると、Amazon EC2 Auto Scaling はアラームのしきい値を超えたときにグループの希望する容量を増減します。
動的スケーリングポリシーが呼び出されると、容量計算によってグループの最小サイズと最大サイズ範囲外の数値が生成された場合、Amazon EC2 Auto Scaling は新しい容量が最小サイズと最大サイズの制限外にならないようにします。キャパシティは、次の 2 つの方法のいずれかで測定されます。1 つは、インスタンスに関して希望するキャパシティを設定するときに選択したものと同じユニットを使用する方法で、もう 1 つはキャパシティユニット (インスタンスの重み付けが適用されている場合) を使用する方法です。
-
例 1: Auto Scaling グループの最大キャパシティーは 3、現在のキャパシティーは 2、および 3 つのインスタンスを追加する動的スケーリングポリシーがあります。このポリシーを呼び出すと、Amazon EC2 Auto Scaling はグループに 1 つのインスタンスのみを追加して、グループが最大サイズを超えないようにします。
-
例 2: Auto Scaling グループの最小キャパシティーは 2、現在のキャパシティーは 3、および 2 つのインスタンスを削除する動的スケーリングポリシーがあります。このポリシーを呼び出すと、Amazon EC2 Auto Scaling はグループから 1 つのインスタンスのみを削除し、グループが最小サイズを下回るのを防ぎます。
希望するキャパシティーが最大サイズ制限に達すると、スケールアウトは停止します。需要が低下し、容量が減少すると、Amazon EC2 Auto Scaling は再びスケールアウトできます。
インスタンスの重み付けを使用する場合は例外です。この場合、Amazon EC2 Auto Scaling は最大サイズ制限を超えてスケールアウトできますが、インスタンスの最大重みまでスケールアウトできます。その意図は、できるだけ新しい希望するキャパシティーに近づけることですが、それでもグループのために指定されている割り当て戦略を遵守することです。割り当て戦略によって、起動するインスタンスタイプを決定します。重みは、インスタンスタイプに基づいて、各インスタンスがグループの希望するキャパシティーに影響するキャパシティーユニット数を決定します。
-
例 3: Auto Scaling グループの最大キャパシティーは 12、現在のキャパシティーは 10、および 5 つのキャパシティーユニットを追加する動的スケーリングポリシーがあります。インスタンスタイプには、1、4、6 の 3 つの重みのいずれかが割り当てられます。ポリシーを呼び出すとき、Amazon EC2 Auto Scaling は、割り当て戦略に基づいて重みが 6 のインスタンスタイプを起動することを選択します。このスケールアウトイベントの結果は、希望するキャパシティーが 12 で、現在のキャパシティーが 16 のグループになります。
複数の動的スケーリングポリシー
ほとんどの場合、ターゲット追跡スケーリングポリシーは、自動的にスケールアウトとスケールインするように Auto Scaling グループからインスタンスをデタッチするには、以下の手順を使用します。 グループを設定するのに十分です。ターゲット追跡スケーリングポリシーでは、希望する結果を選択したら、その結果を達成するために、必要に応じて Auto Scaling グループに対してインスタンスを追加および削除できます。
高度なスケーリング設定では、Auto Scaling グループに複数のスケーリングポリシーを設定できます。例えば、1 つ以上のターゲット追跡スケーリングポリシー、1 つ以上のステップスケーリングポリシー、またはその両方を定義できます。これにより、複数のシナリオに対応できる柔軟性が高まります。
複数の動的スケーリングポリシーがどのように連携するかを説明するために、Auto Scaling グループと Amazon SQS キューを使用して単一の EC2 インスタンスにリクエストを送信するアプリケーションを検討してください。アプリケーションのパフォーマンスを最適なレベルに維持するために、Auto Scaling グループをスケールアウトするタイミングをコントロールする 2 つのポリシーがあるとします。1 つは、カスタムメトリクスを使用してキュー内の SQS メッセージの数に基づいて容量を追加および削除するターゲット追跡ポリシーです。もう 1 つのステップスケーリングポリシーは、Amazon CloudWatch CPUUtilization
メトリクスを使用して、インスタンスが指定された期間に 90% の使用率を超えたときに容量を追加するものです。
同時に有効なポリシーが複数ある場合は、各ポリシーで、Auto Scaling グループが同時にスケールアウト (またはスケールイン) するように指定している可能性があります。例えば、 CloudWatch カスタムCPUUtilization
メトリクスがカスタムメトリクスアラームのしきい値をスパイクおよび超過すると同時に、メトリクスが SQS アラームのしきい値をスパイクおよび超過する可能性があります。
このような状況が発生すると、Amazon EC2 Auto Scaling はスケールアウトとスケールインの両方に最大の容量を提供するポリシーを選択します。例えば、 のポリシーが 1 つのインスタンスCPUUtilization
を起動し、SQS キューのポリシーが 2 つのインスタンスを起動するとします。両方のポリシーのスケールアウト基準が同時に満たされる場合、Amazon EC2 Auto Scaling は SQS キューポリシーを優先します。これにより、Auto Scaling グループは 2 つのインスタンスを起動することになります。
ポリシーがスケールインに異なる基準を使用する場合でも、最大キャパシティーを提供するポリシーを優先するというアプローチが適用されます。例えば、1 つのポリシーが 3 つのインスタンスを終了し、別のポリシーがインスタンス数を 25% 減らし、スケールイン時にグループに 8 つのインスタンスがある場合、Amazon EC2 Auto Scaling は、グループのインスタンス数が最も多いポリシーを優先します。その結果、Auto Scaling グループは 2 つのインスタンスを終了します (8 の 25% = 2)。目的は、Amazon EC2 Auto Scaling が削除するインスタンスが多すぎないようにすることです。
ただし、ターゲット追跡スケーリングポリシーをステップスケーリングポリシーとともに使用する場合、ポリシー間の競合によって望ましくない動作が生じる可能性があるため、注意することをお勧めします。例えば、ターゲット追跡ポリシーがスケールインする準備が整う前に、ステップスケーリングポリシーがスケールインアクティビティを開始した場合、スケールインアクティビティはブロックされません。スケールインアクティビティが完了した後で、ターゲット追跡ポリシーにより、グループに再びスケールアウトするよう指示できます。