Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Scelta dell'approccio di scalabilità automatica
L'elasticità è uno dei principali vantaggi dell'utilizzo di Amazon EMR. Esistono due opzioni principali per scalare automaticamente le risorse:
-
Dimensionamento gestito
-
Una politica di scalabilità personalizzata
Con la scalabilità gestita o una politica di scalabilità automatica personalizzata, puoi scalare all'interno e all'esterno i nodi in modo da utilizzare solo le risorse di cui hai bisogno. La scalabilità orizzontale viene utilizzata per aggiungere più risorse quando è necessaria una maggiore capacità. La scalabilità si traduce in efficienza in termini di costi rimuovendo le risorse che non vengono utilizzate. All'interno del servizio Amazon EMR, i CloudWatch parametri di Amazon sono abilitati per monitorare le risorse in modo da poter scalare il cluster. CloudWatch acquisisce punti dati ogni 5 minuti.
Esistono diverse considerazioni per ciascuno degli approcci di ridimensionamento automatico.
Dimensionamento gestito da Amazon EMR
Utilizza la scalabilità gestita EMR se il tuo carico di lavoro soddisfa i seguenti criteri:
-
È necessaria un'esperienza gestita.
-
Viene utilizzato Amazon EMR 5.330 o versione successiva.
-
È necessaria una frequenza di valutazione di 1 minuto.
-
La soluzione utilizza flotte di istanze per avere da una a cinque opzioni di istanza.
-
Le applicazioni sono basate su Apache Spark, Apache Hive o Apache Hadoop YARN.
Dimensionamento automatico personalizzato
Utilizza una politica di scalabilità automatica personalizzata se il carico di lavoro soddisfa i seguenti criteri:
-
È necessario controllare la metrica per la scalabilità.
-
Viene utilizzato Amazon EMR 4.0+.
-
Non è necessaria una frequenza di valutazione elevata.
-
Non è necessario controllare i periodi di recupero tra i ridimensionamenti consecutivi.
-
È importante controllare quante istanze aggiungere o rimuovere durante il ridimensionamento.
-
La soluzione richiede azioni di ridimensionamento personalizzate. Ad esempio, potresti voler scalare più di un nodo in un periodo di 5 minuti. Oppure potresti voler modificare il periodo di cooldown.
-
Non ci sono restrizioni all'utilizzo di tipi istantanei diversi in un gruppo di istanze.
Suggerimenti per aggiungere la scalabilità automatica al cluster
-
Sii consapevole della quantità di dati che elaborerai. Forecast utilizzando il caso con la maggiore dimensione di dati.
-
Dimensiona correttamente il tuo cluster.
-
Scegli un tipo di storage adatto alle tue esigenze.
-
Comprendi le metriche per un cluster Amazon EMR.
-
Scopri come determinare la metrica giusta
per scalare il tuo cluster. -
Decidi se utilizzare istanze Spot, gruppi di istanze uniformi o flotte di istanze.
-
In base alle informazioni e alle limitazioni, decidi quale tipo di approccio di scalabilità preferisci: scalabilità gestita da Amazon EMR o una politica di scalabilità automatica personalizzata.
-
Configura la scalabilità gestita o la politica personalizzata.
-
Se hai selezionato una politica di scalabilità automatica personalizzata, monitora i parametri di Amazon EMR per ottimizzare le soglie della policy.