Conectar-se a um cluster - Amazon EMR

Conectar-se a um cluster

Ao executar um cluster do Amazon EMR, muitas vezes, tudo o que você precisa fazer é executar uma aplicação para analisar seus dados e depois coletar a saída de um bucket do Amazon S3. Às vezes, você pode querer interagir com o nó primário enquanto o cluster está em execução. Por exemplo, talvez você queira se conectar ao nó primário para executar consultas interativas, verificar arquivos de log, depurar um problema com o cluster, monitorar a performance usando uma aplicação como o Ganglia, que é executada no nó primário e assim por diante. As seções a seguir descrevem técnicas que você pode usar para conectar-se ao nó primário.

Em um cluster do EMR, o nó primário é uma instância do Amazon EC2 que coordena as instâncias do EC2 em execução como nós centrais e de tarefa. O nó primário expõe um nome DNS público que você pode usar para conectar-se a ele. Por padrão, o Amazon EMR cria regras de grupo de segurança para o nó primário e para os nós centrais e de tarefa, que determinam como você acessa esses nós.

nota

Você pode conectar-se ao nó primário somente enquanto o cluster está em execução. Quando o cluster for encerrado, a instância do EC2 atuando como o nó primário será terminada e não estará mais disponível. Para se conectar ao nó primário, você também deve se autenticar para o cluster. Você pode usar o Kerberos para autenticação ou especificar uma chave privada do par de chaves do Amazon EC2 ao iniciar o cluster. Para obter mais informações sobre como configurar o Kerberos e se conectar, consulte Usar o Kerberos para autenticação com o Amazon EMR. Quando executar um cluster no console, a chave privada do par de chaves do Amazon EC2 será especificada na seção Segurança e acesso da página Criar cluster.

Por padrão, o grupo de segurança ElasticMapReduce-master não permite acesso SSH de entrada. Talvez seja necessário adicionar uma regra de entrada que permita acesso SSH (porta TCP 22) a partir das origens às quais você deseja ter acesso. Para obter mais informações sobre como modificar regras de grupos de segurança, consulte Adicionar regras a um grupo de segurança no Guia do usuário do Amazon EC2 para instâncias do Linux.

Importante

Não modifique as regras restantes no grupo de segurança ElasticMapReduce-master. Modificar essas regras pode interferir com o funcionamento do cluster.