Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Lorsque vous créez un cluster Amazon EMR, il est important de prendre en compte la manière dont vous configurez les EC2 instances Amazon et les options réseau. Ce chapitre couvre les options suivantes, puis les relie toutes avec des bonnes pratiques et des directives.
-
Types de nœuds : EC2 les instances Amazon d'un cluster EMR sont organisées en types de nœuds. Il en existe trois : les nœuds primaires, les nœuds principaux et les nœuds de tâches. Chaque type de nœud exécute un ensemble de rôles définis par les applications distribuées que vous installez sur le cluster. Au cours d'une tâche Hadoop MapReduce ou Spark, par exemple, les composants des nœuds principaux et de tâches traitent les données, transfèrent les résultats vers Amazon S3 ou HDFS et fournissent des métadonnées d'état au nœud principal. Dans le cas d'un cluster à un seul nœud, tous les composants s'exécutent sur le nœud primaire. Pour de plus amples informations, veuillez consulter Comprendre les types de nœuds dans Amazon EMR : nœuds principaux, principaux et de tâches.
-
EC2 instances — Lorsque vous créez un cluster, vous faites des choix concernant les EC2 instances Amazon sur lesquelles chaque type de nœud sera exécuté. Le type d'EC2 instance détermine le profil de traitement et de stockage du nœud. Le choix de l' EC2 instance Amazon pour vos nœuds est important car il détermine le profil de performance des différents types de nœuds de votre cluster. Pour de plus amples informations, veuillez consulter Configurer les types d' EC2 instances Amazon à utiliser avec Amazon EMR.
-
Mise en réseau : vous pouvez lancer votre cluster Amazon EMR dans un VPC à l'aide d'un sous-réseau public, d'un sous-réseau privé ou d'un sous-réseau partagé. Votre configuration réseau détermine la manière dont les clients et les services peuvent se connecter aux clusters pour effectuer des tâches, la manière dont les clusters se connectent aux magasins de données et aux autres ressources AWS , ainsi que les options dont vous disposez pour contrôler le trafic sur ces connexions. Pour de plus amples informations, veuillez consulter Configuration de la mise en réseau dans un VPC pour Amazon EMR.
-
Regroupement d'instances : l'ensemble d' EC2instances hébergeant chaque type de nœud est appelé parc d'instances ou groupe d'instances uniforme. La configuration du groupement d'instances est un choix que vous faites lorsque vous créez un cluster. Ce choix détermine la manière dont vous pouvez ajouter des nœuds à votre cluster pendant son exécution. La configuration s'applique à tous les types de nœuds. Il ne peut pas être modifié ultérieurement. Pour de plus amples informations, veuillez consulter Créez un cluster Amazon EMR avec des flottes d'instances ou des groupes d'instances uniformes.
Note
La configuration de flotte d'instances est disponible uniquement dans les versions 4.8.0 et ultérieures d'Amazon EMR, à l'exception des versions 5.0.0 et 5.0.3.