Connessione a un cluster - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Connessione a un cluster

Quando si esegue un cluster Amazon EMR, spesso è sufficiente eseguire un'applicazione per analizzare i dati e raccogliere l'output da un bucket Amazon S3. In altri casi, potresti voler interagire con il nodo primario mentre il cluster è in esecuzione. Ad esempio, potresti volerti connettere al nodo primario per eseguire query interattive, controllare i file di log, eseguire il debug di un problema con il cluster, monitorare le prestazioni utilizzando un'applicazione come Ganglia in esecuzione sul nodo primario e così via. Le sezioni seguenti descrivono le tecniche che è possibile utilizzare per connettersi al nodo primario.

In un cluster EMR, il nodo primario è un'istanza Amazon EC2 che coordina le istanze EC2 in esecuzione come nodi attività e core. Il nodo primario espone un nome DNS pubblico che è possibile utilizzare per connettersi ad esso. Per impostazione predefinita, Amazon EMR crea regole del gruppo di sicurezza per il nodo primario e i nodi core e attività, che determinano la modalità di accesso ai nodi.

Nota

È possibile connettersi al nodo primario solo mentre il cluster è in esecuzione. Quando il cluster termina, l'istanza EC2 che funge da nodo primario viene terminata e non è più disponibile. Per connettersi al nodo primario, è necessario anche autenticarsi al cluster. È possibile utilizzare Kerberos per l'autenticazione, o specificare una coppia di chiavi private Amazon EC2 quando si avvia il cluster. Per ulteriori informazioni sulla configurazione di Kerberos e sulla connessione, vedere Utilizzo di Kerberos per l'autenticazione con Amazon EMR. Quando avvii un cluster dalla console, la coppia di chiavi Amazon EC2 private è specificata nella sezione Security and Access (Sicurezza e accesso) della pagina Create Cluster (Crea cluster).

Per impostazione predefinita, il gruppo di sicurezza ElasticMapReduce -master non consente l'accesso SSH in entrata. Potrebbe essere necessario aggiungere una regola in entrata che consenta l'accesso SSH (porta TCP 22) dalle sorgenti a cui si desidera accedere. Per ulteriori informazioni sulla modifica delle regole dei gruppi di sicurezza, consulta Adding rules to a security group nella Amazon EC2 User Guide.

Importante

Non modificare le regole rimanenti nel gruppo di sicurezza ElasticMapReduce -master. La modifica di queste regole può interferire con il funzionamento del cluster.