Configuration de la classe d'environnement Amazon MWAA - Amazon Managed Workflows for Apache Airflow

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration de la classe d'environnement Amazon MWAA

La classe d'environnement que vous choisissez pour votre environnement Amazon MWAA détermine la taille des AWS Fargate conteneurs AWS gérés dans lesquels le Celery Executor s'exécute, ainsi que la base de données de métadonnées AWS Amazon Aurora PostgreSQL gérée dans laquelle les planificateurs Apache Airflow créent des instances de tâches. Cette page décrit chaque classe d'environnement Amazon MWAA et les étapes à suivre pour mettre à jour la classe d'environnement sur la console Amazon MWAA.

Capacités environnementales

La section suivante contient les tâches Apache Airflow simultanées par défaut, la mémoire vive (RAM) et les unités de traitement centralisées virtuelles (vCPU) pour chaque classe d'environnement. Les tâches simultanées répertoriées supposent que la simultanéité des tâches ne dépasse pas la capacité d'Apache Airflow Worker dans l'environnement.

Dans le tableau suivant, la capacité du DAG fait référence aux définitions du DAG, et non aux exécutions, et suppose que vos DAG sont dynamiques dans un seul fichier Python et écrits selon les meilleures pratiques d'Apache Airflow.

Les exécutions de tâches dépendent du nombre de tâches planifiées simultanément et supposent que le nombre d'exécutions DAG définies pour démarrer en même temps ne dépasse pas le nombre par défaut max_dagruns_per_loop_to_schedule, ainsi que la taille et le nombre de travailleurs, comme indiqué dans cette rubrique.

mw1.small
  • Capacité jusqu'à 50 DAG

  • 5 tâches simultanées (par défaut)

  • 1 vCPU

  • 2 GO DE RAM

mw1.medium
  • Capacité jusqu'à 200 DAG

  • 10 tâches simultanées (par défaut)

  • 2 vCPU

  • 4 GO DE RAM

mw1.large
  • Capacité jusqu'à 1000 DAG

  • 20 tâches simultanées (par défaut)

  • 4 vCPU

  • 8 Go de RAM

mw1.xlarge
  • Capacité jusqu'à 2 000 DAG

  • 40 tâches simultanées (par défaut)

  • 8 vCPU

  • 24 GO DE RAM

mw1.2xlarge
  • Capacité jusqu'à 4000 DAG

  • 80 tâches simultanées (par défaut)

  • 16 vCPU

  • 48 GO DE RAM

Vous pouvez l'utiliser celery.worker_autoscale pour augmenter le nombre de tâches par travailleur. Pour plus d’informations, consultez le Exemple de cas d'utilisation à hautes performances.

Planificateurs Apache Airflow

La section suivante décrit les options du planificateur Apache Airflow disponibles sur Amazon MWAA et explique comment le nombre de planificateurs affecte le nombre de déclencheurs.

Dans Apache Airflow, un déclencheur gère les tâches qu'il reporte jusqu'à ce que certaines conditions spécifiées à l'aide d'un déclencheur soient remplies. Dans Amazon MWAA, le déclencheur s'exécute parallèlement au planificateur sur la même tâche Fargate. L'augmentation du nombre de planificateurs augmente en conséquence le nombre de déclencheurs disponibles, optimisant ainsi la façon dont l'environnement gère les tâches différées. Cela garantit une gestion efficace des tâches, en les planifiant rapidement pour qu'elles s'exécutent lorsque les conditions sont satisfaites.

Apache Airflow v2
  • v2 - Accepte les valeurs comprises entre et 25. La valeur par défaut est 2.