AWS Batch
ユーザーガイド

ジョブの再試行の自動化

ジョブおよびジョブ定義に再試行戦略を適用し、ジョブが失敗した場合に自動的に再試行できます。以下のような場合に失敗します。

  • コンテナジョブのゼロ以外の終了コード

  • Amazon EC2 インスタンスの障害または終了

  • AWS サービスの内部エラーまたは停止

ジョブがジョブキューに送信されて RUNNING 状態になると、1 回の試行とみなされます。デフォルトでは、各ジョブは 1 回の試行で SUCCEEDED または FAILED のいずれかの状態に移行します。ただし、ジョブ定義とジョブ送信の両方のワークフローで、1〜10 回の再試行戦略を指定できます。詳細については、「再試行戦略」を参照してください。

ランタイムに、AWS_BATCH_JOB_ATTEMPT 環境変数がコンテナの対応するジョブ試行番号に設定されます。最初の試行は 1 番となり、後続の試行は昇順の番号 (2、3、4 など) になります。

何らかの理由でジョブの試行が失敗し、再試行戦略で指定した試行数が AWS_BATCH_JOB_ATTEMPT 数より大きい場合、ジョブは再び RUNNABLE 状態に戻されます。ジョブの各状態の詳細については、「ジョブの状態」を参照してください。

注記

ジョブをキャンセルまたは終了した場合、ジョブは再試行されません。無効なジョブ定義のためにジョブが失敗した場合も、ジョブは再試行されません。

詳細については、「ジョブ定義の作成」および「ジョブの送信」を参照してください。