Uso del dimensionamento del cluster - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Uso del dimensionamento del cluster

È possibile regolare il numero di istanze Amazon EC2 disponibili per un cluster Amazon EMR automaticamente o manualmente in risposta a carichi di lavoro con richieste variabili. Per utilizzare il dimensionamento automatico, sono disponibili due opzioni. Puoi abilitare il dimensionamento gestito da Amazon EMR o creare una policy di dimensionamento automatico personalizzato. La tabella seguente descrive le differenze tra le due opzioni.

Dimensionamento gestito da Amazon EMR Dimensionamento automatico personalizzato

Policy e regole di dimensionamento

Non è richiesta alcuna policy. Amazon EMR gestisce l'attività di dimensionamento automatico valutando continuamente i parametri del cluster e prendendo decisioni di dimensionamento ottimizzate.

È necessario definire e gestire le policy e le regole di dimensionamento automatico, ad esempio le condizioni specifiche che attivano le attività di dimensionamento, i periodi di valutazione, i periodi di attesa e così via.

Versioni di Amazon EMR supportate

Amazon EMR versione 5.30.0 e successive (tranne Amazon EMR versione 6.0.0)

Amazon EMR 4.0.0 e versioni successive

Composizione cluster supportata

Gruppi di istanze o parchi istanze

Solo gruppi di istanze

Configurazione dei limiti di dimensionamento

I limiti di dimensionamento sono configurati per l'intero cluster.

I limiti di dimensionamento possono essere configurati solo per ogni gruppo di istanze.

Frequenza di valutazione dei parametri

Ogni 5-10 secondi

Una valutazione più frequente dei parametri consente ad Amazon EMR di prendere decisioni di dimensionamento più precise.

È possibile definire i periodi di valutazione solo in incrementi di cinque minuti.

Applicazioni supportate

Sono supportate solo le applicazioni YARN, come Spark, Hadoop, Hive, Flink. Il dimensionamento gestito da Amazon EMR non supporta applicazioni non basate su YARN, come Presto o HBase.

È possibile scegliere quali applicazioni sono supportate quando si definiscono le regole di dimensionamento automatico.

Considerazioni

  • Un cluster Amazon EMR è sempre costituito da uno o tre nodi primari. Non è possibile dimensionare il numero di nodi primari successivamente alla configurazione iniziale del cluster. È possibile dimensionare solo i nodi core e task in un cluster.

  • Le operazioni di riconfigurazione e ridimensionamento di un gruppo di istanze non possono essere eseguite contemporaneamente. Se viene avviata una riconfigurazione durante il ridimensionamento di un gruppo di istanze, la riconfigurazione non può iniziare finché il ridimensionamento del gruppo di istanze non è terminato, e viceversa.