Aggiornamento di un ambiente Amazon MWAA - Amazon Managed Workflows for Apache Airflow

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Aggiornamento di un ambiente Amazon MWAA

Nota

Gli aggiornamenti corretti di Amazon MWAA non sono ancora supportati nelle regioni Canada occidentale (Calgary) e Asia Pacifico (Malesia).

Gli aggiornamenti dell'ambiente Amazon MWAA applicano le modifiche e le patch di sicurezza più recenti. Puoi anche modificare le configurazioni esistenti e aggiornare la versione di Apache Airflow. Questa guida descrive i passaggi per aggiornare un ambiente Amazon MWAA.

Prima di iniziare

  • La rete VPC specificata per l'ambiente non può essere modificata dopo la creazione dell'ambiente.

  • È necessario un bucket Amazon S3 configurato per bloccare tutti gli accessi pubblici, con Bucket Versioning abilitato.

  • È necessario un AWS account con autorizzazioni per utilizzare Amazon MWAA e autorizzazione in AWS Identity and Access Management (IAM) per creare ruoli IAM. Se scegli la modalità di accesso alla rete privata per il server Web Apache Airflow, che limita l'accesso ad Apache Airflow all'interno del tuo Amazon VPC, avrai bisogno dell'autorizzazione in IAM per creare endpoint Amazon VPC.

  • Per abilitare gli aggiornamenti dell'ambiente Graceful, devi eseguire l'aggiornamento alla versione 2.4.3 o successiva di Apache Airflow. Per aggiornare la versione Airflow, vedi. Aggiornamento della versione di Apache Airflow

Strategia di sostituzione dei lavoratori

Puoi scegliere una strategia di sostituzione dei lavoratori per controllare il modo in cui Amazon MWAA gestisce i lavoratori attivi durante un aggiornamento dell'ambiente. Puoi selezionare una delle seguenti strategie:

Aggiornamenti forzati

L'aggiornamento forzato è la strategia di sostituzione dei lavoratori predefinita. Gli aggiornamenti forzati interrompono immediatamente tutti i lavoratori attivi, impedendo l'esecuzione delle attività durante l'aggiornamento.

Aggiornamenti eleganti

Gli aggiornamenti Graceful consentono ai lavoratori di continuare a svolgere le attività fino a 12 ore prima della chiusura. Previene il fallimento delle attività a causa delle interruzioni degli aggiornamenti, purché vengano completate in meno di 12 ore. Le nuove attività vengono indirizzate ai lavoratori aggiornati.

Per abilitare gli aggiornamenti di Graceful su un ambiente esistente, è necessario completare un aggiornamento forzato e assicurarsi che l'ambiente sia sulla versione 2.4.3 o successiva di Apache Airflow.

Nota

Se si esegue un aggiornamento mentre l'ambiente è attivo, la strategia di sostituzione dei lavoratori per qualsiasi aggiornamento continuo dell'ambiente passa da a. MAINTENANCE GRACEFUL FORCED L'aggiornamento viene eseguito al termine della manutenzione.

Aggiorna le risorse dell'ambiente

Gli aggiornamenti dell'ambiente Amazon MWAA utilizzano per impostazione predefinita la configurazione dell'ambiente esistente. Per aggiornare l'ambiente senza modificare la configurazione attuale:

  1. Apri la pagina Ambienti sulla console Amazon MWAA.

  2. Dall'elenco Ambienti, scegli l'ambiente che desideri aggiornare.

  3. Nella pagina dell'ambiente, scegli Modifica per modificare l'ambiente.

  4. Scegli Avanti fino alla pagina Rivedi e salva.

  5. Nella pagina Rivedi e salva, rivedi le modifiche, quindi scegli Salva.

Aggiorna un ambiente

La sezione seguente descrive i passaggi per aggiornare un ambiente Amazon MWAA.

Fase uno: specificare i dettagli

Per specificare i dettagli per l'ambiente
  1. Apri la pagina Ambienti sulla console Amazon MWAA.

  2. Dall'elenco Ambienti, scegli l'ambiente che desideri aggiornare.

  3. Nella pagina dell'ambiente, scegli Modifica per modificare l'ambiente.

  4. Nella sezione Dettagli sull'ambiente, per la versione Airflow, scegli il nuovo numero di versione di Apache Airflow a cui desideri aggiornare l'ambiente dall'elenco a discesa.

    Nota

    Prima di eseguire l'aggiornamento, assicurati che le tue DAGs e le altre risorse del flusso di lavoro siano compatibili con la nuova versione di Apache Airflow. Per ulteriori informazioni, consulta Aggiornamento della versione di Apache Airflow.

  5. Sotto il codice DAG in Amazon S3, specifica quanto segue:

    1. Bucket S3. Scegli Browse S3 e seleziona il tuo bucket Amazon S3 oppure inserisci l'URI Amazon S3.

    2. DAGs folder. Scegli Browse S3 e seleziona la dags cartella nel tuo bucket Amazon S3 oppure inserisci l'URI Amazon S3.

    3. File dei plugin: opzionale. Scegli Browse S3 e seleziona il plugins.zip file nel tuo bucket Amazon S3 oppure inserisci l'URI Amazon S3.

    4. File dei requisiti: opzionale. Scegli Browse S3 e seleziona il requirements.txt file nel tuo bucket Amazon S3 oppure inserisci l'URI Amazon S3.

    5. File di script di avvio: facoltativo, scegli Sfoglia S3 e seleziona il file di script sul tuo bucket Amazon S3 oppure inserisci l'URI di Amazon S3.

  6. Scegli Next (Successivo).

Fase due: configurare le impostazioni avanzate

Configurazione delle impostazioni avanzate
  1. In Accesso al server Web, seleziona la modalità di accesso Apache Airflow preferita:

    1. Rete privata. Ciò limita l'accesso all'interfaccia utente di Apache Airflow agli utenti all'interno del tuo Amazon VPC a cui è stato concesso l'accesso alla policy IAM per il tuo ambiente. È necessaria l'autorizzazione per creare endpoint Amazon VPC per questa fase.

      Nota

      Scegli l'opzione Rete privata se si accede all'interfaccia utente di Apache Airflow solo all'interno di una rete aziendale e non è necessario accedere a repository pubblici per l'installazione dei requisiti del server Web. Se scegli questa opzione di modalità di accesso, devi creare un meccanismo per accedere al tuo server Web Apache Airflow nel tuo Amazon VPC. Per ulteriori informazioni, consulta Accesso all'endpoint VPC per il server Web Apache Airflow (accesso alla rete privata).

    2. Rete pubblica. Ciò consente l'accesso all'interfaccia utente di Apache Airflow tramite Internet agli utenti a cui è concesso l'accesso alla policy IAM per l'ambiente in uso.

  2. In Gruppi di sicurezza, scegli il gruppo di sicurezza utilizzato per proteggere il tuo Amazon VPC:

    1. Per impostazione predefinita, Amazon MWAA crea un gruppo di sicurezza nel tuo Amazon VPC con regole specifiche in entrata e in uscita in Crea nuovo gruppo di sicurezza.

    2. Facoltativo. Deseleziona la casella di controllo in Crea nuovo gruppo di sicurezza per selezionare fino a 5 gruppi di sicurezza.

      Nota

      Un gruppo di sicurezza Amazon VPC esistente deve essere configurato con regole specifiche in entrata e in uscita per consentire il traffico di rete. Per ulteriori informazioni, consulta Sicurezza nel tuo VPC su Amazon MWAA.

  3. In Classe Environment, scegli una classe di ambiente.

    Ti consigliamo di scegliere la dimensione più piccola necessaria per supportare il tuo carico di lavoro. Puoi cambiare la classe di ambiente in qualsiasi momento.

  4. Per Numero massimo di lavoratori, specifica il numero massimo di lavoratori Apache Airflow da eseguire nell'ambiente.

    Per ulteriori informazioni, consulta Esempio di utilizzo ad alte prestazioni.

  5. Specificare Numero massimo di server Web e Numero minimo di server Web per configurare il modo in cui Amazon MWAA ridimensiona i server Web Apache Airflow nel tuo ambiente.

    Per ulteriori informazioni sulla scalabilità automatica dei server Web, consulta. Configurazione della scalabilità automatica del server Web Amazon MWAA

  6. In Crittografia, scegli un'opzione di crittografia dei dati:

    1. Per impostazione predefinita, Amazon MWAA utilizza una chiave AWS proprietaria per crittografare i dati.

    2. Facoltativo. Scegli Personalizza le impostazioni di crittografia (avanzate) per scegliere una chiave diversa. AWS KMS Se si sceglie di specificare una chiave gestita dal cliente in questo passaggio, è necessario specificare un ID AWS KMS chiave o un ARN. AWS KMS gli alias e le chiavi multiregionali non sono supportati da Amazon MWAA. Se hai specificato una chiave Amazon S3 per la crittografia lato server sul tuo bucket Amazon S3, devi specificare la stessa chiave per il tuo ambiente Amazon MWAA.

      Nota

      È necessario disporre delle autorizzazioni per la chiave per selezionarla sulla console Amazon MWAA. È inoltre necessario concedere le autorizzazioni ad Amazon MWAA per utilizzare la chiave allegando la politica descritta in. Allega una politica chiave

  7. Consigliato. In Monitoraggio, scegli una o più categorie di log per la configurazione di registrazione Airflow per inviare i log di Apache Airflow a Logs: CloudWatch

    1. Registri delle attività di Airflow. Scegli il tipo di log delle attività di Apache Airflow da inviare a CloudWatch Logs in Log level.

    2. Registri del server web Airflow. Scegli il tipo di log del server web Apache Airflow da inviare a CloudWatch Logs in Log level.

    3. Registri dello scheduler Airflow. Scegli il tipo di log dello scheduler Apache Airflow da inviare a Logs in Log level. CloudWatch

    4. Registri degli operatori di Airflow. Scegli il tipo di log di lavoro di Apache Airflow da inviare a CloudWatch Logs in Log level.

    5. Registri di elaborazione Airflow DAG. Scegli il tipo di log di elaborazione di Apache Airflow DAG da inviare a Logs in Log level. CloudWatch

  8. Facoltativo. Per le opzioni di configurazione Airflow, scegli Aggiungi opzione di configurazione personalizzata.

    Puoi scegliere dall'elenco a discesa suggerito delle opzioni di configurazione di Apache Airflow per la tua versione di Apache Airflow o specificare opzioni di configurazione personalizzate. Ad esempio,:. core.default_task_retries 3

  9. In Autorizzazioni, scegli un ruolo di esecuzione:

    1. Per impostazione predefinita, Amazon MWAA crea un ruolo di esecuzione in Crea un nuovo ruolo. È necessario disporre dell'autorizzazione per creare ruoli IAM per utilizzare questa opzione.

    2. Facoltativo. Scegli Inserisci ruolo ARN per inserire l'Amazon Resource Name (ARN) di un ruolo di esecuzione esistente.

  10. In Specifiche di aggiornamento, scegli un Strategia di sostituzione dei lavoratori per controllare come vengono gestiti i lavoratori attivi durante un aggiornamento.

  11. Scegli Next (Successivo).

Fase tre: revisione e aggiornamento

Per esaminare un riepilogo dell'ambiente
  • Esamina il riepilogo dell'ambiente, scegli Salva.

    Nota

    Sono necessari dai venti ai trenta minuti per aggiornare un ambiente utilizzando aggiornamenti forzati. Il completamento degli aggiornamenti dell'ambiente di Graceful può richiedere fino a dodici ore, poiché attende il completamento delle attività in corso.