翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Lambda を使用したカスタム終了ポリシーを作成する
Amazon EC2 Auto Scaling は、終了ポリシーを使用して、Auto Scaling グループのサイズを小さくするときに、どのインスタンスを最初に終了するかを優先します ( ではスケーリングと呼ばれます)。Auto Scaling グループではデフォルトの終了ポリシーを使用しますが、独自の終了ポリシーを選択または作成することもできます。定義済みの終了ポリシーを選択する方法の詳細については、「Amazon EC2 Auto Scaling の終了ポリシーを設定する」を参照してください。
このトピックでは、Amazon EC2 Auto Scaling が特定のイベントに応答して呼び出す AWS Lambda 関数を使用してカスタム終了ポリシーを作成する方法について説明します。作成した Lambda 関数は、Amazon EC2 Auto Scaling によって送信された入力データ内の情報を処理し、終了する準備ができているインスタンスのリストを返します。
カスタム終了ポリシーを使用すると、終了するインスタンスとタイミングをより適切に制御できます。例えば、Auto Scaling グループがスケールインすると、Amazon EC2 Auto Scaling は中断すべきではない実行中のワークロードがあるかどうかを判断できません。Lambda 関数を使用すると、終了リクエストを検証し、ワークロードが完了するまで待ってから、インスタンス ID を終了のために Amazon EC2 Auto Scaling に返すことができます。
入力データ
Amazon EC2 Auto Scaling は、スケールインイベント用のJSONペイロードを生成します。また、インスタンスの最大有効期間またはインスタンス更新機能の結果としてインスタンスが終了する時期にも生成します。また、アベイラビリティーゾーン間でグループを再調整するときに開始できるスケールインイベントのJSONペイロードも生成します。
このペイロードには、Amazon EC2 Auto Scaling を終了するために必要な容量、終了を提案するインスタンスのリスト、終了を開始したイベントに関する情報が含まれています。
次にペイロードの例を示します。
{
"AutoScalingGroupARN": "arn:aws:autoscaling:us-east-1:<account-id>:autoScalingGroup:d4738357-2d40-4038-ae7e-b00ae0227003:autoScalingGroupName/my-asg",
"AutoScalingGroupName": "my-asg",
"CapacityToTerminate": [
{
"AvailabilityZone": "us-east-1b",
"Capacity": 2,
"InstanceMarketOption": "on-demand"
},
{
"AvailabilityZone": "us-east-1b",
"Capacity": 1,
"InstanceMarketOption": "spot"
},
{
"AvailabilityZone": "us-east-1c",
"Capacity": 3,
"InstanceMarketOption": "on-demand"
}
],
"Instances": [
{
"AvailabilityZone": "us-east-1b",
"InstanceId": "i-0056faf8da3e1f75d",
"InstanceType": "t2.nano",
"InstanceMarketOption": "on-demand"
},
{
"AvailabilityZone": "us-east-1c",
"InstanceId": "i-02e1c69383a3ed501",
"InstanceType": "t2.nano",
"InstanceMarketOption": "on-demand"
},
{
"AvailabilityZone": "us-east-1c",
"InstanceId": "i-036bc44b6092c01c7",
"InstanceType": "t2.nano",
"InstanceMarketOption": "on-demand"
},
...
],
"Cause": "SCALE_IN"
}
ペイロードには、Auto Scaling グループの名前、その Amazon リソースネーム (ARN)、および次の要素が含まれます。
-
CapacityToTerminate
は、特定のアベイラビリティーゾーンで終了するように設定されたスポットまたはオンデマンドのキャパシティーを示します。 -
Instances
は、Amazon EC2 Auto Scaling が の情報に基づいて終了を提案するインスタンスを表しますCapacityToTerminate
。 -
Cause
は、終了の原因となったイベントである
、SCALE_IN
INSTANCE_REFRESH
、MAX_INSTANCE_LIFETIME
、REBALANCE
を示します。
次の情報は、Amazon EC2 Auto Scaling がInstances
入力データで を生成する方法における最も重要な要因の概要を示しています。
-
イベントのスケールインとインスタンスの更新ベースの終了によりインスタンスが終了する場合は、アベイラビリティーゾーン間でバランスを維持するのが優先されます。そのため、グループに使用されている他のアベイラビリティーゾーンより多くのインスタンスが含まれるアベイラビリティーゾーンがある場合、入力データのインスタンスはそのバランスのとれていないアベイラビリティーゾーンのみからインスタンスに適用されます。グループに使用されているアベイラビリティーゾーンのバランスがとれている場合、入力データにはグループのすべてのアベイラビリティーゾーンのインスタンスが含まれます。
-
混合インスタンスポリシーを使用する場合、各購入オプションの希望する割合に基づいて、スポットおよびオンデマンドのキャパシティーをバランスよく維持することも優先されます。まず、2 つのタイプ (スポットまたはオンデマンド) のどちらを終了すべきかを識別します。次に、アベイラビリティーゾーンのバランスが最も高い結果となるアベイラビリティーゾーンを終了できるインスタンス (特定された購入オプション内) を特定します。
レスポンスデータ
入力データと応答データが連携して、終了するインスタンスのリストを絞り込みます。
指定された入力では、Lambda 関数からの応答は次の例のようになります。
{
"InstanceIDs": [
"i-02e1c69383a3ed501",
"i-036bc44b6092c01c7",
...
]
}
InstanceIDs
は、終了する準備ができているインスタンスを表します。
または、終了する準備ができている別のインスタンスのセットを返すこともできます。これにより、入力データのインスタンスが上書きされます。Lambda 関数が呼び出されたときに終了する準備ができていない場合は、インスタンスを返さないように選択することもできます。
終了する準備ができているインスタンスがない場合、Lambda 関数からの応答は次の例のようになります。
{
"InstanceIDs": [ ]
}
考慮事項
カスタム終了ポリシーを使用する場合、次の点を考慮してください。
-
レスポンスデータで最初にインスタンスを返しても、その終了は保証されません。Lambda 関数が呼び出されたときに必要な数を超えるインスタンスが返された場合、Amazon EC2 Auto Scaling は、Auto Scaling グループに指定した他の終了ポリシーと照らし合わせて各インスタンスを評価します。複数の終了ポリシーがある場合、リスト内の次の終了ポリシーを適用しようとします。終了に必要な数を超えるインスタンスがある場合は、次の終了ポリシーに移ります。他の終了ポリシーが指定されていない場合は、デフォルトの終了ポリシーを使用して、終了するインスタンスを決定します。
-
インスタンスが返されない場合、または Lambda 関数がタイムアウトした場合、Amazon EC2 Auto Scaling は関数を再度呼び出す前に少し待機します。どのようなスケールインイベントでも、グループの希望する容量が現在の容量よりも小さい限り、試行し続けます。例えば、リフレッシュベースの終了の場合、1 時間試行し続けます。その後、インスタンスの終了に失敗し続けると、インスタンスの更新操作は失敗します。インスタンスの最大有効期間では、Amazon EC2 Auto Scaling は最大有効期間を超えたと識別されたインスタンスを終了しようとし続けます。
-
関数は繰り返し再試行されるため、Lambda 関数をカスタム終了ポリシーとして使用する前に、コード内の永続的なエラーをテストして修正してください。
-
入力データを独自のインスタンスのリストで上書きして終了すると、これらのインスタンスを終了すると、アベイラビリティーゾーンのバランスが崩れ、Amazon EC2 Auto Scaling はアベイラビリティーゾーン間の容量の分散を徐々に再調整します。まず、Lambda 関数を呼び出して、リバランシングを開始するかどうかを判断できるように、終了する準備ができているインスタンスがあるかどうかを確認します。終了する準備ができているインスタンスがある場合、最初に新しいインスタンスを起動します。インスタンスの起動が完了すると、グループの現在の容量が希望する容量よりも大きいことを検出し、イベントでスケールを開始します。
-
カスタム終了ポリシーは、スケールイン保護を使用して特定のインスタンスが終了されないように保護する機能には影響しません。詳細については、「インスタンススケールイン保護を使用してインスタンスの終了を制御する」を参照してください。
Lambda 関数を作成する
まず、Lambda 関数を作成して、Auto Scaling グループの終了ポリシーでその Amazon リソースネーム (ARN) を指定できるようにします。
Lambda 関数を作成するには (コンソール)
Lambda コンソールで [Functions (関数)] ページ
を開きます。 -
画面の上部のナビゲーションバーで、Auto Scaling グループの作成時に使用したのと同じリージョンを選択します。
-
[Create function (関数の作成)] を選択し、[Author from scratch (一から作成)] を選択します。
-
[基本的な情報] の [関数名] に、関数の名前を入力します。
-
[Create function (関数の作成)] を選択します。関数のコードと設定に戻ります。
-
関数をまだコンソールで開いている状態で、関数コードの下にエディタに貼り付けます。
-
[デプロイ] を選択します。
-
必要に応じて、Lambda 関数の公開バージョンを作成するには、[Versions (バージョン)] タブをクリックし、次に新しいバージョンを発行します。Lambda でのバージョニングの詳細については、AWS Lambda デベロッパーガイドの「Lambda 関数のバージョン」を参照してください。
-
バージョンを公開することを選択した場合、このバージョンの Lambda 関数と関連付けるには [Aliases (エイリアス)] タブを選択します。Lambda のエイリアスの詳細については、AWS Lambda デベロッパーガイドの「Lambda 関数のエイリアス」を参照してください。
-
次に [Configuration (設定)] タブと [Permissions (アクセス許可)] を選択します。
-
[Resource-based policy (リソースベースのポリシー)] にスクロールダウンして [アクセス許可の追加] を選択します。リソースベースのポリシーを使用して、関数を呼び出すアクセス許可を、ポリシーで指定されているプリンシパルに付与します。この場合、プリンシパルはEC2Auto Scaling グループに関連付けられている Amazon Auto Scaling サービスにリンクされたロールになります。 Auto Scaling
-
[Policy statement (ポリシーステートメント)] セクションで、権限を設定します。
-
AWS アカウント を選択します。
-
プリンシパル には、呼び出し元のサービスにリンクされたロールARNの を入力します。例えば、 と入力します
arn:aws:iam::<aws-account-id>:role/aws-service-role/autoscaling.amazonaws.com/AWSServiceRoleForAutoScaling
。 -
アクション で、Lambda InvokeFunctionを選択します。
-
[Statement ID (ステートメント ID)] に
AllowInvokeByAutoScaling
といった一意のステートメント ID を入力します。 -
[Save] を選択します。
-
-
これらの指示に従ったら、次のステップとして Auto Scaling グループの終了ポリシーで関数ARNの を引き続き指定します。詳細については、「Auto Scaling グループの終了ポリシーを変更する」を参照してください。
注記
Lambda 関数を開発するためのリファレンスとして使用できる例については、「Amazon EC2 Auto Scaling のGitHub リポジトリ
制限事項
-
Auto Scaling グループの終了ポリシーで指定できる Lambda 関数は 1 つだけです。複数の終了ポリシーが指定されている場合は、最初に Lambda 関数を指定する必要があります。
-
Lambda 関数は、非修飾 ARN (サフィックスなし) またはバージョンまたはエイリアスARNをサフィックスとする修飾 を使用して参照できます。非修飾 ARNが使用されている場合 ( など
function:my-function
)、リソースベースのポリシーは、関数の未公開バージョンで作成する必要があります。修飾 ARNが使用されている場合 (function:my-function:1
や などfunction:my-function:prod
)、リソースベースのポリシーは、その特定の公開バージョンの関数で作成する必要があります。 -
サフィックスARNで修飾
$LATEST
を使用することはできません。$LATEST
サフィックスを持つ修飾 を参照するカスタム終了ポリシーを追加しようとするARNと、エラーが発生します。 -
入力データで提供されるインスタンスの数は、30,000 インスタンスまでに制限されています。終了できるインスタンスが 30,000 個を超える場合、入力データには インスタンスの最大数が戻されることを示す
"HasMoreInstances": true
を示します。 -
Lambda 関数の最大実行時間は 2 秒 (2000 ミリ秒) です。ベストプラクティスとして、予想される実行時間に基づいて Lambda 関数のタイムアウト値を設定する必要があります。Lambda 関数のデフォルトのタイムアウトは 3 秒ですが、これを減らすことができます。
-
ランタイムが 2 秒の制限を超えると、ランタイムがこのしきい値を下回るまで、すべてのスケールインアクションが保留されます。ランタイムが一貫して長い Lambda 関数の場合は、後続の Lambda 呼び出し中に取得できる結果をキャッシュするなどして、ランタイムを短縮する方法を見つけます。