As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Etapa 5: Teste o EMR cluster da Amazon passo a passo
Uma técnica útil quando você está tentando rastrear a origem de um erro é reiniciar o cluster e enviar as etapas a ele uma por uma. Isso permite que você verifique os resultados de cada etapa antes de processar a seguinte e dá a você a oportunidade de corrigir e executar novamente uma etapa que tenha apresentado falha. Isso também permite que você carregue seus dados de entrada somente uma vez.
Para testar um cluster passo a passo
-
Execute um novo cluster, com as proteções de encerramento e keep alive ativadas. A proteção keep alive mantém o cluster em execução após ter processado todas as suas etapas pendentes. A proteção de encerramento impede que um cluster seja encerrado no caso de um erro. Para ter mais informações, consulte Configurando um EMR cluster da Amazon para continuar ou encerrar após a execução da etapa e Usando a proteção contra rescisão para proteger seus EMR clusters da Amazon contra o desligamento acidental.
-
Envie uma etapa para o cluster. Para obter mais informações, consulte Envie o trabalho para um EMR cluster da Amazon.
-
Quando a etapa for concluída, verifique se há erros de processamento nos arquivos de log da etapa. Para obter mais informações, consulte Etapa 4: Examine os arquivos de EMR log da Amazon. A maneira mais rápida de localizar esses arquivos de log é estabelecer uma conexão com o nó principal e exibir os arquivos de log. Os arquivos de log da etapa não serão exibidos até que a etapa seja executada por algum tempo, seja concluída ou apresente uma falha.
-
Se a etapa for concluída com êxito, execute a próxima etapa. Se houver erros, investigue o erro nos arquivos de log. Se houve um erro em seu código, faça a correção e execute novamente a etapa. Continue até que todas as etapas sejam executadas sem erros.
-
Quando você terminar a depuração do cluster e quiser encerrá-lo, deverá fazê-lo manualmente. Isso é necessário porque o cluster foi iniciado com a proteção de encerramento ativada. Para obter mais informações, consulte Usando a proteção contra rescisão para proteger seus EMR clusters da Amazon contra o desligamento acidental.