Configuration d'un cluster pour qu'il continue ou se résilie après l'exécution de l'étape
Cette rubrique explique les différences entre l'utilisation d'un cluster de longue durée et la création d'un cluster transitoire qui s'arrête après l'exécution de la dernière étape. Il explique également comment configurer l'exécution des étapes pour un cluster.
Création d'un cluster à long terme
Par défaut, les clusters que vous créez avec la console ou l'AWS CLI sont de longue durée. Les clusters de longue durée continuent de fonctionner, d'accepter du travail et d'accumuler des frais jusqu'à ce que vous preniez des mesures pour les arrêter.
Un cluster de longue durée est efficace dans les situations suivantes :
-
Lorsque vous devez interroger des données de manière interactive ou automatique.
-
Lorsque vous devez interagir en permanence avec des applications Big Data hébergées sur le cluster.
-
Lorsque vous traitez périodiquement un jeu de données si important ou si fréquent qu'il est inefficace de lancer de nouveaux clusters et de charger les données à chaque fois.
Vous pouvez également définir une protection contre la résiliation sur un cluster de longue durée afin d'éviter d'arrêter les instances EC2 par accident ou par erreur. Pour de plus amples informations, veuillez consulter Utilisation de la protection contre la résiliation.
Note
Amazon EMR active automatiquement la protection contre les résiliations pour tous les clusters comportant plusieurs nœuds primaires et remplace tous les paramètres d'exécution des étapes que vous fournissez lors de la création du cluster. Vous pouvez désactiver la protection contre la résiliation après le lancement du cluster. Consultez Configuration de la protection contre la résiliation pour les clusters en cours d'exécution. Pour résilier un cluster comportant plusieurs nœuds primaires, vous devez d'abord modifier les attributs du cluster afin de désactiver la protection contre la résiliation. Pour obtenir des instructions, consultez Résiliation d'un cluster Amazon EMR avec plusieurs nœuds primaires.
Configurer un cluster pour qu'il se résilie après l'exécution de l'étape
Lorsque vous configurez la résiliation après l'exécution des étapes, le cluster démarre, exécute des actions d'amorçage, puis exécute les étapes que vous spécifiez. Dès que la dernière étape est terminée, Amazon EMR résilie les instances Amazon EC2 du cluster. L'exécution par étapes est activée par défaut pour les clusters que vous lancez avec l'API Amazon EMR.
Le fait de résilier après l'exécution d'une étape est efficace pour les clusters qui effectuent une tâche de traitement périodique, telle qu'une exécution quotidienne de traitement de données. L'exécution des étapes vous permet également de vous assurer que vous n'êtes facturé que pour le temps nécessaire au traitement de vos données. Pour plus d'informations sur ces étapes, consultez Soumission de travail à un cluster.
Note
Nous avons repensé la console Amazon EMR pour la rendre plus facile à utiliser. Consultez Nouveautés de la console pour en savoir plus sur les différences entre les anciennes et les nouvelles expériences de console.