Etapa 5: verificar se há grupos suspensos - Amazon EMR

Etapa 5: verificar se há grupos suspensos

Um grupo de instâncias fica suspenso quando encontra muitos erros ao tentar executar nós. Por exemplo, se novos nós falharem repetidamente durante a execução de ações de bootstrap, depois de algum tempo, o grupo de instâncias entrará no estado SUSPENDED em vez de tentar provisionar continuamente novos nós.

Um nó poderá falhar se:

  • O Hadoop ou o cluster estiver de alguma forma com problemas e não aceitar um novo nó no cluster

  • Uma ação de bootstrap falhar no novo nó

  • O nó não estava funcionando corretamente e não conseguir fazer check-in no Hadoop

Se um grupo de instâncias estiver no estado SUSPENDED, e o cluster estiver em um estado WAITING, você poderá adicionar uma etapa de cluster para redefinir o número desejado de nós core e de tarefa. Adicionar a etapa retoma o processamento do cluster e coloca o grupo de instâncias em um estado RUNNING.

Para obter mais informações sobre como redefinir um cluster em um estado suspenso, consulte Estado suspenso.