Pianificazione e configurazione dei nodi primari - Amazon EMR

Pianificazione e configurazione dei nodi primari

Quando avvii un cluster Amazon EMR, puoi scegliere di avere uno o tre nodi primari nel cluster. L'avvio di un cluster con tre nodi primari è supportato solo da Amazon EMR versione 5.23.0 e successive. Amazon EMR può trarre vantaggio dai gruppi di collocamento EC2 per garantire che i nodi primari siano posizionati su hardware sottostante distinto al fine di migliorare ulteriormente la disponibilità del cluster. Per ulteriori informazioni, consulta Integrazione di Amazon EMR con gruppi di collocamento EC2.

Un cluster Amazon EMR con più nodi primari fornisce i seguenti vantaggi chiave:

  • Il nodo primario non rappresenta più un singolo punto di errore. Se uno dei nodi primari riscontra errori, il cluster utilizza gli altri due nodi primari e viene eseguito senza interruzioni. Nel frattempo, Amazon EMR sostituisce automaticamente i nodi primari con errori con un nuovo nodo dotato delle stesse operazioni di configurazione e bootstrap.

  • Amazon EMR abilita le caratteristiche ad alta disponibilità Hadoop di HDFS NameNode e YARN ResourceManager e supporta l'alta disponibilità per altre applicazioni open source.

    Per ulteriori informazioni su come un cluster EMR con più nodi primari supporta le applicazioni open source e altre caratteristiche Amazon EMR, consulta la sezione Applicazioni e caratteristiche supportate.

Nota

I cluster possono trovarsi in una sola zona di disponibilità o sottorete.

Questa sezione fornisce informazioni sulle applicazioni e sulle caratteristiche supportate di un cluster Amazon EMR con più nodi primari nonché i dettagli di configurazione, le best practice e le considerazioni in merito all'avvio del cluster.