翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon EC2 Auto Scaling のターゲットトラッキングスケーリングポリシー
ターゲット追跡スケーリングポリシーは、ターゲットメトリクス値に基づいて Auto Scaling グループのキャパシティーを自動的にスケーリングします。これにより、手動で操作しなくても、アプリケーションは最適なパフォーマンスとコスト効率を維持できます。
ターゲット追跡を使用することで、アプリケーションの理想的な平均使用率またはスループットレベルを表すメトリクスとターゲット値を選択します。Amazon EC2 Auto Scaling は、メトリクスがターゲットから逸脱したときにスケーリングイベントをトリガーする CloudWatch アラームを作成および管理します。これは、サーモスタットがターゲット温度を維持する仕組みと似ています。
例えば、現在 2 つのインスタンスで実行されているアプリケーションがあり、アプリケーションの負荷が変化しても Auto Scaling グループの CPU 使用率を約 50% に維持する必要があるとします。これにより、過剰な数のアイドルリソースを維持することなくトラフィックのスパイクを処理するための追加のキャパシティが得られます。
このニーズを満たすには、50% の平均 CPU 使用率をターゲットとする、ターゲット追跡スケーリングポリシーを作成します。その後、CPU が 50% を超えると、Auto Scaling グループは増加した負荷を処理するためにスケールアウト (容量を増やす) されます。CPU が 50% を下回るとスケールイン (容量が減少) し、使用率が低い期間のコストを最適化します。
トピック
複数のターゲット追跡スケーリングポリシー
スケーリングパフォーマンスを最適化するために複数のターゲット追跡スケーリングポリシーを同時に使用できますが、それぞれが異なるメトリクスを使用する必要があります。例えば、使用率とスループットは互いに影響し合う可能性があります。これは、これらのメトリクスのいずれかが変更されるたびに、通常、他のメトリクスも影響を受けることを意味します。このため、複数のメトリクスを使用することで、Auto Scaling グループの負荷に関する追加情報が提供され、グループに追加するキャパシティを判断する際の意思決定が容易になります。
Amazon EC2 Auto Scaling の目的は常に可用性を優先することであるため、その動作は、ターゲット追跡ポリシーでスケールアウトまたはスケールインの準備ができているかによって異なります。ターゲット追跡ポリシーのいずれかでスケールアウトする準備ができると、Auto Scaling グループがスケールアウトされますが、すべてのターゲット追跡ポリシー (スケールイン部分が有効) でスケールインする準備ができている場合にのみスケールインされます。
メトリクスを選択する
事前定義されたメトリクスまたはカスタムメトリクスのいずれかを使用して、ターゲット追跡スケーリングポリシーを作成できます。
事前定義されたメトリクスタイプでターゲット追跡スケーリングポリシーを作成する場合、次の事前定義済みメトリクスのリストからメトリクスを選択します。
-
ASGAverageCPUUtilization
- Auto Scaling グループの平均 CPU 使用率。 -
ASGAverageNetworkIn
- すべてのネットワークインターフェイスで単一のインスタンスが受信した平均バイト数。 -
ASGAverageNetworkOut
- すべてのネットワークインターフェイスで単一のインスタンスから送信された平均バイト数。 -
ALBRequestCountPerTarget
- ターゲットあたりの Application Load Balancer の平均リクエスト数。
重要
ターゲットごとの CPU 使用率、ネットワーク I/O、および Application Load Balancer リクエスト数のメトリクスに関するその他の貴重な情報は、Linux インスタンス用 Amazon EC2 ユーザーガイドの「インスタンスに使用可能な CloudWatch メトリクスのリスト」トピックと、CloudWatch Application Load Balancer 用ユーザーガイドの「Application Load Balancer トピックのメトリクス」にそれぞれ記載されています。 Amazon EC2
カスタム CloudWatch メトリクスを指定 CloudWatch することで、利用可能な他のメトリクスまたは で独自のメトリクスを選択できます。カスタマイズされたメトリクス仕様でターゲット追跡ポリシーを作成するには、 AWS CLI または SDK を使用する必要があります。を使用してターゲット追跡スケーリングポリシーのカスタマイズされたメトリクス仕様を指定する例については AWS CLI、「」を参照してくださいAWS Command Line Interface (AWS CLI) のスケーリングポリシーの例。
メトリクスを選択するときは、以下の点に注意してください。
-
使用状況の変化に応じてより迅速にスケールできるように、1 分間隔で利用可能なメトリクスのみを使用することをお勧めします。ターゲット追跡では、すべての事前定義済みメトリクスとカスタムメトリクスについて 1 分単位で集計されたメトリクスが評価されますが、基礎となるメトリクスによっては、データが公開される頻度は低くなる可能性があります。たとえば、Amazon EC2 メトリクスはすべてデフォルトで 5 分間隔で送信されますが、1 分に設定できます (詳細モニタリングと呼ばれます)。この選択は個々のサービス次第です。ほとんどのサービスは、可能な限り短い間隔を使用しようとします。詳細モニタリングを有効にする方法については、「Auto Scaling インスタンスのモニタリングを設定する」を参照してください。
-
カスタムメトリクスにはターゲット追跡に使用できないものもあります。メトリクスは、有効な使用率メトリクスで、インスタンスの使用頻度を示す必要があります。メトリクス値は Auto Scaling グループのインスタンス数に比例して増減する必要があります。それにより、メトリクスデータを使用して比例的にインスタンス数をスケールアウトまたはスケールインできます。例えば、
CPUUtilization
Auto Scaling グループの負荷がインスタンス間で分散されている場合、Auto Scaling グループの CPU 使用率 (メトリクスディメンションAutoScalingGroupName
を持つ Amazon EC2 メトリクス ) は有効です。 -
以下のメトリクスはターゲットの追跡では機能しません。
-
Auto Scaling グループの前にあるロードバランサーが受信したリクエスト数 (つまり、Elastic Load Balancing メトリクス
RequestCount
)。ロードバランサーによって受信されたリクエストの数は、Auto Scaling グループの使用率に基づいて変化しません。 -
ロードバランサーのリクエストのレイテンシー (Elastic Load Balancing メトリクス
Latency
)。リクエストのレイテンシーは、使用率の増加により増える場合がありますが、必ずしも比例して変化するわけではありません。 -
CloudWatch Amazon SQS キューメトリクス
ApproximateNumberOfMessagesVisible
。キュー内のメッセージ数は、キューからのメッセージを処理する Auto Scaling グループのサイズに比例して変わらない可能性があるためです。ただし、Auto Scaling グループの EC2 インスタンスごとにキュー内のメッセージの数を測定するカスタムメトリクスは機能します。詳しくは、「Amazon SQS に基づくスケーリング」を参照してください。
-
-
ALBRequestCountPerTarget
メトリクスを使用するには、ResourceLabel
パラメータを指定して、メトリクスに関連付けられているロードバランサーターゲットグループを識別する必要があります。を使用してターゲット追跡スケーリングポリシーのResourceLabel
パラメータを指定する例については AWS CLI、「」を参照してくださいAWS Command Line Interface (AWS CLI) のスケーリングポリシーの例。 -
メトリクスが に実数 0 の値を出力する場合 CloudWatch (例:
ALBRequestCountPerTarget
)、Auto Scaling グループは、アプリケーションへのトラフィックが一定期間存在しない場合に 0 にスケールインできます。Auto Scaling グループにリクエストがルーティングされないときに Auto Scaling グループを 0 にスケールインするには、グループの最小キャパシティを 0 に設定する必要があります。 -
スケーリングポリシーで使用する新しいメトリクスを公開する代わりに、メトリクス数式を使用して既存のメトリクスを組み合わせることができます。詳細については、「Metric Math を使用する、Amazon EC2 Auto Scaling のターゲット追跡スケーリングポリシーを作成する」を参照してください。
ターゲット値の定義
ターゲット追跡スケーリングポリシーを作成するときは、ターゲット値を指定する必要があります。ターゲット値は、Auto Scaling グループの最適な平均使用率またはスループットを表します。優れたコスト効率でリソースを使用するには、予期しないトラフィックの増加に対して適切なバッファを使用し、ターゲット値をできる限り高く設定します。アプリケーションが通常のトラフィックフローに対して最適にスケールアウトされる場合、実際のメトリクス値は、ターゲット値以下である必要があります。
スケーリングポリシーが Application Load Balancer のターゲットごとのリクエスト数、ネットワーク I/O、またはその他のカウントメトリクスなどのスループットに基づいている場合、ターゲット値は単一のインスタンスからの最適な 1 分間の平均スループットを表します。
インスタンスのウォームアップ時間の定義
オプションで、新しく起動されたインスタンスのウォームアップ時間を秒単位で指定できます。指定されたウォームアップ期間が終了するまで、インスタンスは Auto Scaling グループの集約された EC2 インスタンスメトリクスにカウントされません。
インスタンスのウォームアップ期間中、スケーリングポリシーは、ウォームアップしていないインスタンスからのメトリクス値がポリシーのターゲット使用率を超える場合にのみスケールアウトします。
グループが再度スケールアウトする場合、まだウォームアップ中のインスタンスは、次のスケールアウトアクティビティの希望キャパシティーの一部として計上されます。その目的は、スケールアウトを継続的に (ただし過剰になることなく) 行うことです。
スケールアウトアクティビティの進行中は、インスタンスがウォームアップを終了するまで、スケーリングポリシーによって開始されたすべてのスケールインアクティビティがブロックされます。インスタンスのウォームアップが完了し、スケールインイベントが発生した場合、現在終了中のインスタンスは、新しい必要キャパシティーを計算する際にグループの現在のキャパシティーにカウントされます。したがって、Auto Scaling グループから必要以上の数のインスタンスが削除されることがなくなります。
デフォルト値
値が設定されていない場合、スケーリングポリシーは、グループに定義されたデフォルトのインスタンスウォームアップの値であるデフォルト値を使用します。インスタンスのデフォルトウォームアップが null の場合、デフォルトクールダウン の値にフォールバックします。ウォームアップ時間が変更されたときにすべてのスケーリングポリシーを簡単に更新できるように、デフォルトのインスタンスウォームアップを使用することをお勧めします。
考慮事項
ターゲット追跡スケーリングポリシーを使用する場合は、次の考慮事項が適用されます。
-
ターゲット追跡スケーリングポリシーで使用される CloudWatch アラームを作成、編集、削除しないでください。Amazon EC2 Auto Scaling は、ターゲット追跡スケーリングポリシーに関連付けられているアラームを作成および管理 CloudWatchし、不要になったら削除します。
-
ターゲット追跡スケーリングポリシーは、トラフィック減少時に徐々にスケールインすることにより、トラフィックレベルが変動する期間中の可用性を優先します。ワークロードの終了時に Auto Scaling グループを迅速にスケールインするには、ポリシーのスケールイン部分を無効にします。これにより、使用率が低い場合に、ニーズに最適なスケールイン方法を使用できる柔軟性を得られます。スケールインができる限り迅速に行われるようにするには、クールダウン期間が追加されないように、シンプルなスケーリングポリシーを使用しないことをお勧めします。
-
メトリクスにデータポイントがない場合、 CloudWatch アラームの状態は に変わります
INSUFFICIENT_DATA
。この状態になると、Amazon EC2 Auto Scaling は、新しいデータポイントが見つかるまでグループをスケールできなくなります。 -
メトリクスが設計上まばらに報告される場合は、メトリクス数式が役立つことがあります。例えば、最新の値を使用するには、
FILL(m1,REPEAT)
という関数を使用します (m1
がメトリクスです)。 -
ターゲット値と実際のメトリクスデータポイント間にギャップが発生する場合があります。これは、追加または削除するインスタンス数を決定するときに、その数を切り上げまたは切り捨てて常に控えめに動作するためです。これにより、不十分な数のインスタンスを追加したり、インスタンスを過剰に削除したりすることがなくなります。ただし、インスタンス数が少ない、より小さな Auto Scaling グループでは、グループの使用率はターゲット値からかなり離れているように見える場合があります。例えば、CPU 使用率に 50 パーセントのターゲット値を設定し、Auto Scaling グループがそのターゲットを超過した場合です。1.5 インスタンスを追加することで CPU 使用率が 50 パーセント近くに減少すると判断される場合があります。1.5 インスタンスを追加することはできないので、これを切り上げて、2 インスタンスを追加します。これにより、CPU 使用率は 50 パーセント未満の値に下がる可能性がありますが、アプリケーションをサポートする十分なリソースが確保されます。同様に、1.5 インスタンスを削除することで CPU 使用率が 50 パーセントを超えると判断した場合、1 インスタンスのみを削除します。
より多くのインスタンスのある大規模な Auto Scaling グループの場合、使用率はより多くのインスタンス間で分散されます。その場合、インスタンスの追加または削除により、ターゲット値と実際のメトリクスデータポイントとの差が小さくなります。
-
ターゲットの追跡スケーリングポリシーでは、指定されたメトリクスがターゲット値を超えている場合、Auto Scaling グループをスケールアウトする必要があるとみなされます。指定されたメトリクスがターゲット値を下回っている場合、ターゲット追跡スケーリングポリシーを使用して Auto Scaling グループをスケールアウトすることはできません。
ターゲット追跡スケーリングポリシーを作成する
Auto Scaling グループのターゲット追跡スケーリングポリシーを作成するには、次のいずれかの方法を使用します。
開始する前に、(Amazon EC2 メトリクスのデフォルトが 5 分間隔であることを踏まえて) 希望するメトリクスが 1 分間隔で利用可能であることを確認してください。