フリートをオートスケーリングする - AWSクラウドでのウェブアプリケーションのホスティング

フリートをオートスケーリングする

AWS クラウドアーキテクチャと従来型のホスティングモデルの間の主な違いの 1 つは、AWS はウェブアプリケーションフリートを自動的にオンデマンドでスケールして、トラフィックの変化に対応できます。従来のホスティングモデルでは、通常、トラフィック予測モデルを使用して、予測されるトラフィックよりも先にホストをプロビジョニングします。AWS では、フリートをスケールアウトおよびスケールインするための一連のトリガーに従って、インスタンスをオンザフライでプロビジョニングできます。

Auto Scaling サービスでは、必要に応じて拡張または縮小できるサーバーの容量グループを作成できます。また、Auto Scaling は、CloudWatch と連動してメトリクスデータを取得し、Elastic Load Balancing と連動してホストの追加と削除を実行し負荷を分散します。例えば、ウェブサーバーが一定期間、80 パーセントを超える CPU 利用率を報告する場合、追加のウェブサーバーが迅速にデプロイされ、自動的にロードバランサーに追加されて、ロードバランシングのローテーションに直ちに含められます。

AWS ウェブホスティングアーキテクチャモデルで示しているように、アーキテクチャの異なるレイヤーに複数の Auto Scaling グループを作成して、各レイヤーが独立してスケールするようにできます。例えば、ウェブサーバーの Auto Scaling グループは、ネットワークの I/O の変化に応じてスケールインやスケールアウトをトリガーし、アプリケーションサーバーの Auto Scaling グループは、CPU の使用状況に従ってスケールアウトやスケールインされるなどです。最小値と最大値を設定することで、24 時間 365 日の可用性を確保し、グループ内での使用量を制限できます。

Auto Scaling トリガーは、特定のレイヤーでフリート全体の拡大と縮小の両方を設定し、リソース使用率を実際の需要に合わせることができます。Auto Scaling サービスに加えて、Amazon EC2 API を介して、Amazon EC2 フリートを直接スケールできるため、インスタンスの開始、終了、検査が可能になります。