Conecte-se a um EMR cluster da Amazon - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Conecte-se a um EMR cluster da Amazon

Quando você executa um EMR cluster da Amazon, geralmente tudo o que você precisa fazer é executar um aplicativo para analisar seus dados e, em seguida, coletar a saída de um bucket do Amazon S3. Às vezes, você pode querer interagir com o nó primário enquanto o cluster está em execução. Por exemplo, talvez você queira se conectar ao nó primário para executar consultas interativas, verificar arquivos de log, depurar um problema com o cluster, monitorar a performance usando uma aplicação como o Ganglia, que é executada no nó primário e assim por diante. As seções a seguir descrevem técnicas que você pode usar para conectar-se ao nó primário.

Em um EMR cluster, o nó primário é uma EC2 instância da Amazon que coordena as EC2 instâncias que estão sendo executadas como tarefas e nós principais. O nó primário expõe um DNS nome público que você pode usar para se conectar a ele. Por padrão, a Amazon EMR cria regras de grupo de segurança para o nó primário e para os nós principais e de tarefas, que determinam como você acessa os nós.

nota

Você pode conectar-se ao nó primário somente enquanto o cluster está em execução. Quando o cluster é encerrado, a EC2 instância que atua como nó primário é encerrada e não está mais disponível. Para se conectar ao nó primário, você também deve se autenticar para o cluster. Você pode usar o Kerberos para autenticação ou especificar uma EC2 chave privada de par de chaves da Amazon ao iniciar o cluster. Para obter mais informações sobre como configurar o Kerberos e se conectar, consulte Use o Kerberos para autenticação com a Amazon EMR. Quando você executa um cluster a partir do console, a EC2 chave privada do par de chaves da Amazon é especificada na seção Segurança e acesso na página Criar cluster.

Por padrão, o grupo de segurança ElasticMapReduce -master não permite acesso de entradaSSH. Talvez seja necessário adicionar uma regra de entrada que permita o SSH acesso (TCPporta 22) das fontes que você deseja acessar. Para obter mais informações sobre a modificação das regras do grupo de segurança, consulte Adicionar regras a um grupo de segurança no Guia do EC2 usuário da Amazon.

Importante

Não modifique as regras restantes no grupo de segurança ElasticMapReduce -master. Modificar essas regras pode interferir com o funcionamento do cluster.