Spot Instance クォータ
実行中および要求されたスポットインスタンスの数、そして保留中のスポット インスタンスの数には、各リージョンにつき AWS アカウント ごとに割り当てがあります。保留中のスポットインスタンスリクエストが受理されると、実行中のインスタンスがクォータにカウントされるため、リクエストはクォータにカウントされなくなります。
スポットインスタンスのクォータは、仮想中央演算装置 (vCPU) の数について管理されます。この数は、実行中のスポットインスタンスが使用中であるか、未処理のスポットインスタンスリクエストの受理が保留中であるため、後に使用されるかにより決定されます。ユーザーがスポットインスタンスを終了しており、かつスポットインスタンスリクエストをキャンセルしていない場合、Amazon EC2 がスポットインスタンスの終了を検出してリクエストを閉じるまで、リクエストはスポットインスタンスでの vCPU のクォータ数についてカウントされます。
スポットインスタンスには以下のクォータタイプが用意されています。
名前 | デフォルト | 引き上げ可能 |
---|---|---|
オール DL スポットインスタンスリクエスト | 0 | 可能 |
すべての F スポットインスタンスリクエスト | 0 | 可能 |
オール G および VT スポットインスタンスリクエスト | 0 | 可能 |
すべての Inf スポットインスタンスリクエスト | 0 | 可能 |
すべての P4、P3、および P2 スポットインスタンスリクエスト | 0 | 可能 |
すべての P5 スポットインスタンスリクエスト | 0 | 可能 |
すべての標準 (A、C、D、H、I、M、R、T、Z) スポットインスタンスリクエスト | 5 | 可能 |
すべての Trn スポットインスタンスリクエスト | 0 | 可能 |
すべての X スポットインスタンスリクエスト | 0 | 可能 |
スポットインスタンスの上限は、使用量に基づき Amazon EC2 によって自動的に引き上げられますが、必要であればクォータの引き上げをリクエストすることも可能です。例えば、現在のクォータで許可されているよりも多くの スポットインスタンス を起動する場合は、クォータの引き上げをリクエストできます。また、スポットインスタンスリクエストを送信した後にエラー Max spot instance count exceeded
を受け取ったとしても、クォータの引き上げをリクエストできます。クォータの増加を要求するには、Amazon EC2 の Service Quotas で説明されている Service Quotas コンソールを使用します。
変化するアプリケーションのニーズに合わせて、任意の組み合わせのインスタンスタイプを起動できます。例えば、オールスタンダードスポットインスタンスリクエストのクォータが 256 vCPU の場合、32 m5.2xlarge
個のスポットインスタンス (32 x 8 vCPU) または、16 c5.4xlarge
個のスポットインスタンス (16 x 16 vCPU) をリクエストできます。
Amazon CloudWatch のメトリクス統合では、クォータに対して EC2 の使用量をモニタリングできます。クォータに近づいたときに警告を発するようにアラームを設定することもできます。詳細については、Service Quotas ユーザーガイドの「Service Quotas と Amazon CloudWatch アラーム」。