Utilizzo della protezione dalle terminazioni per proteggere i cluster Amazon EMR da arresti accidentali - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo della protezione dalle terminazioni per proteggere i cluster Amazon EMR da arresti accidentali

La protezione dalla terminazione protegge i cluster dalla chiusura accidentale, il che può essere particolarmente utile per i cluster di lunga durata che elaborano carichi di lavoro critici. Quando la protezione dalla terminazione è abilitata su un cluster a esecuzione prolungata, è comunque possibile terminare il cluster, ma è necessario prima rimuovere esplicitamente la protezione dalla terminazione dal cluster. Ciò aiuta a garantire che le istanze EC2 non verranno arrestate in modo accidentale o per errore. È possibile abilitare la protezione da cessazione al momento della creazione di un cluster ed è possibile modificare l'impostazione su un cluster in esecuzione.

Se la protezione da cessazione è abilitata, l'operazione TerminateJobFlows nell'API di Amazon EMR non funziona. Gli utenti non sono in grado di terminare il cluster utilizzando questa API né il comando terminate-clusters di AWS CLI. L'API restituisce un errore e l'interfaccia a riga di comando (CLI) si chiude con un codice restituito diverso da zero. Se utilizzi la console Amazon EMR per terminare un cluster, ti viene richiesto di eseguire una fase supplementare per disattivare la protezione da terminazione.

avvertimento

La protezione da cessazione non garantisce che i dati vengano conservati in caso di errore umano o di soluzione alternativa, ad esempio se un comando di riavvio viene emesso dalla riga di comando mentre è connesso all'istanza tramite SSH, se un'applicazione o uno script in esecuzione sull'istanza emette un comando di riavvio o se l'API Amazon EC2 o Amazon EMR viene utilizzata per disattivare la protezione da cessazione. Questo vale anche se utilizzi le versioni 7.1 e successive di Amazon EMR e un'istanza diventa non integra e irrecuperabile. Anche se la protezione da cessazione è abilitata, i dati salvati nell'archiviazione dell'istanza, inclusi i dati HDFS, possono andare persi. Scrivi l'output dei dati nei percorsi Amazon S3 e crea strategie di backup appropriate per i tuoi requisiti di business continuity.

Questo tipo di protezione non pregiudica la possibilità di dimensionare le risorse del cluster mediante una delle seguenti operazioni:

Protezione da cessazione e Amazon EC2

L'impostazione di protezione dalla terminazione in un cluster Amazon EMR corrisponde all'attributo per DisableApiTermination tutte le istanze Amazon EC2 del cluster. Ad esempio, se abiliti la protezione dalle terminazioni in un cluster EMR, Amazon EMR DisableApiTermination imposta automaticamente su true per tutte le istanze EC2 all'interno del cluster EMR. Lo stesso vale se disabiliti la protezione dalla terminazione. Amazon EMR si imposta automaticamente su false DisableApiTermination per tutte le istanze EC2 all'interno del cluster EMR. Se interrompi o riduci un cluster da Amazon EMR e le impostazioni di Amazon EC2 sono in conflitto per un'istanza EC2, Amazon EMR dà la priorità all'impostazione Amazon EMR rispetto alle DisableApiTermination impostazioni DisableApiStop and in Amazon EC2 e continua a terminare l'istanza EC2.

Ad esempio, puoi utilizzare la console Amazon EC2 per abilitare la protezione dalle terminazioni su un'istanza Amazon EC2 in un cluster EMR con la protezione dalla terminazione disabilitata. Se interrompi o riduci il cluster con la console Amazon EMR, AWS CLI l'API Amazon EMR, Amazon EMR DisableApiTermination sovrascrive l'impostazione, la imposta su false e termina l'istanza insieme ad altre istanze.

Puoi anche utilizzare la console Amazon EC2 per abilitare la protezione da arresto su un'istanza Amazon EC2 in un cluster EMR con la protezione dalle terminazioni disabilitata. Se interrompi o riduci il cluster, Amazon EMR DisableApiStop imposta su false in Amazon EC2 e termina l'istanza insieme ad altre istanze.

Amazon EMR sostituisce l'DisableApiStopimpostazione solo quando interrompi o riduci un cluster. Quando abiliti o disabiliti la protezione dalla terminazione in un cluster EMR, Amazon EMR non modifica disableApiStop l'impostazione per nessuna delle istanze EC2 nel rispettivo cluster EMR.

Importante

Se crei un'istanza come parte di un cluster Amazon EMR con protezione dalle terminazioni e utilizzi l'API o i comandi di Amazon EC2 per modificare l'istanza in modo che DisableApiTermination sia così, e quindi l'API o AWS CLI i comandi di Amazon EC2 eseguono l'operazionefalse, TerminateInstances l'istanza Amazon EC2 viene terminata. AWS CLI

Protezione da cessazione e nodi YARN con stato Unhealthy (Non integro)

Amazon EMR controlla periodicamente lo stato dei nodi Apache Hadoop YARN in esecuzione sulle istanze Amazon EC2 principali o attività in un cluster. Lo stato di salute viene segnalato dal servizio Health Checker. NodeManager Se un nodo segnalaUNHEALTHY, il controller di istanza Amazon EMR aggiunge il nodo a una denylist e non gli assegna contenitori YARN finché non torna a funzionare. A seconda dello stato di protezione dalla terminazione, della sostituzione dei nodi non integri e della versione di rilascio di Amazon EMR, Amazon EMR sostituirà l'istanza non integra o interromperà l'allocazione dei controller all'istanza.

Protezione dalla terminazione e terminazione dopo l'esecuzione di una fase

Quando abiliti la terminazione dopo l'esecuzione della fase e abiliti anche la protezione dalla terminazione, Amazon EMR ignora la protezione dalla terminazione.

Quando si inviano fasi a un cluster, è possibile impostare la proprietà ActionOnFailure per stabilire cosa accede se la fase non può completare l'esecuzione a causa di un errore. I valori possibile per questa impostazione sono TERMINATE_CLUSTER (TERMINATE_JOB_FLOW con le versioni precedenti), CANCEL_AND_WAIT e CONTINUE. Per ulteriori informazioni, consulta Invia il lavoro a un cluster Amazon EMR.

Se una fase configurata con ActionOnFailure set to fallisceCANCEL_AND_WAIT, se è abilitata la terminazione dopo l'esecuzione della fase, il cluster si interrompe senza eseguire i passaggi successivi.

Se una fase, configurata con ActionOnFailure impostato su TERMINATE_CLUSTER, non riesce, è possibile utilizzare la tabella delle impostazioni riportata di seguito per determinare il risultato.

ActionOnFailure Terminazione dopo l'esecuzione della fase Termination protection (Protezione da cessazione) Risultato

TERMINATE_CLUSTER

Abilitato

Disabilitato

Il cluster viene terminato

Abilitato

Abilitato

Il cluster viene terminato

Disabilitato

Abilitato

Il cluster non viene terminato

Disabilitato

Disabilitato

Il cluster viene terminato

Protezione da cessazione e istanze Spot

L'opzione di protezione da cessazione di Amazon EMR non impedisce l'arresto di un'istanza Spot di Amazon EC2 quando il prezzo Spot supera il prezzo Spot massimo.

Configurazione della protezione da cessazione all'avvio di un cluster

È possibile abilitare o disabilitare la protezione dalla terminazione quando si avvia un cluster utilizzando la console AWS CLI, l'o l'API.

Per i cluster a nodo singolo, le impostazioni predefinite di protezione dalla terminazione sono le seguenti:

  • Avvio di un cluster tramite Amazon EMR Console —Termination Protection è disabilitato per impostazione predefinita.

  • L'avvio di un cluster tramite AWS CLI aws emr create-cluster —Termination Protection è disabilitato a meno che non sia specificato. --termination-protected

  • L'avvio di un cluster tramite il comando RunJobFlowAPI Amazon EMR: Termination Protection è disabilitato a meno che TerminationProtected il valore booleano non sia impostato su. true

Per i cluster ad alta disponibilità, le impostazioni predefinite di protezione dalla terminazione sono le seguenti:

  • Avvio di un cluster tramite Amazon EMR Console: la protezione dalle terminazioni è abilitata per impostazione predefinita.

  • L'avvio di un cluster tramite AWS CLI aws emr create-cluster —Termination Protection è disabilitato a meno che non sia specificato. --termination-protected

  • L'avvio di un cluster tramite il comando RunJobFlowAPI Amazon EMR: Termination Protection è disabilitato a meno che TerminationProtected il valore booleano non sia impostato su. true

Console
Per attivare o disattivare la protezione dalla terminazione quando crei un cluster con la console
  1. Accedi a e apri Console di gestione AWS la console Amazon EMR su https://console.aws.amazon.com /emr.

  2. In EMR on EC2 (EMR su EC2), nel riquadro di navigazione a sinistra, scegli Clusters (Cluster) e seleziona Create cluster (Crea cluster).

  3. Per EMR release version (Versione del rilascio EMR), scegli emr-6.6.0 o un rilascio successivo.

  4. In Terminazione del cluster e sostituzione del nodo, assicurati che l'opzione Usa protezione dalla terminazione sia preselezionata oppure deseleziona la selezione per disattivarla.

  5. Scegli qualsiasi altra opzione applicabile al cluster.

  6. Per avviare il cluster, scegli Create cluster (Crea cluster).

AWS CLI
Per attivare o disattivare la protezione dalla terminazione quando crei un cluster utilizzando il AWS CLI
  • Con AWS CLI, è possibile avviare un cluster con la protezione dalla terminazione abilitata con il create-cluster comando con il --termination-protected parametro. Per impostazione predefinita, la protezione da cessazione è disabilitata.

    Nell'esempio seguente viene creato un cluster con protezione da cessazione abilitata:

    Nota

    I caratteri di continuazione della riga Linux (\) sono inclusi per la leggibilità. Possono essere rimossi o utilizzati nei comandi Linux. Per Windows, rimuovili o sostituiscili con un accento circonflesso (^).

    aws emr create-cluster --name "TerminationProtectedCluster" --release-label emr-7.12.0 \ --applications Name=Hadoop Name=Hive Name=Pig \ --use-default-roles --ec2-attributes KeyName=myKey --instance-type m5.xlarge \ --instance-count 3 --termination-protected

    Per ulteriori informazioni sull'utilizzo dei comandi Amazon EMR in AWS CLI, consulta. https://docs.aws.amazon.com/cli/latest/reference/emr

Configurazione della protezione da cessazione per i cluster in esecuzione

È possibile configurare la protezione da terminazione per un cluster in esecuzione con la console o la AWS CLI.

Console
Per attivare o disattivare la protezione dalla terminazione per un cluster in esecuzione con la console
  1. Accedi a e apri Console di gestione AWS la console Amazon EMR su https://console.aws.amazon.com /emr.

  2. In EMR on EC2 (EMR su EC2), nel riquadro di navigazione a sinistra, scegli Clusters (Cluster) e seleziona il cluster da aggiornare.

  3. Nella scheda Properties (Proprietà) della pagina dei dettagli del cluster, cerca Cluster termination (Terminazione del cluster) e seleziona Edit (Modifica).

  4. Seleziona o deseleziona la casella di controllo Use termination protection (Utilizza la protezione da terminazione) per attivare o disattivare la caratteristica. Quindi seleziona Save changes (Salva modifiche) per confermare.

AWS CLI
Per attivare o disattivare la protezione dalla terminazione per un cluster in esecuzione, utilizza AWS CLI
  • Per abilitare la protezione da terminazione su un cluster in esecuzione con la AWS CLI, utilizza il comando modify-cluster-attributes con il parametro --termination-protected. Per disabilitarla, utilizza il parametro --no-termination-protected.

    L'esempio seguente abilita la protezione dalla terminazione sul cluster con ID: j-3KVTXXXXXX7UG

    aws emr modify-cluster-attributes --cluster-id j-3KVTXXXXXX7UG --termination-protected

    Nell'esempio seguente viene disabilitata la protezione da cessazione sullo stesso cluster:

    aws emr modify-cluster-attributes --cluster-id j-3KVTXXXXXX7UG --no-termination-protected