ステップ 5: 中断されたグループの確認 - Amazon EMR

ステップ 5: 中断されたグループの確認

ノードの起動を試行中にエラーが多数発生したとき、インスタンスグループは中断されます。例えば、ブートストラップアクションの実行中に新しいノードが繰り返し失敗した場合、インスタンスグループは、しばらくすると、新しいノードのプロビジョニングを引き続き試みることなく、SUSPENDED 状態になります。

たとえば、次のような場合に、ノードが表示されないことがあります。

  • Hadoop またはクラスターが何らかの理由で破損し、クラスターへの新しいノードを受け入れない

  • ブートストラップアクションが新しいノードで失敗した

  • ノードが適切に機能していないため、Hadoop でチェックインできない

インスタンスグループが SUSPENDED 状態で、クラスターが WAITING 状態の場合は、クラスターステップを追加して、必要な数のコアおよびタスクノードをリセットできます。ステップを追加することで、クラスターの処理が再開し、インスタンスグループが RUNNING 状態に戻ります。

中断状態のクラスターをリセットする方法については、「停止状態」を参照してください。