Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Choisissez une AWS région pour votre EMR cluster Amazon
Amazon Web Services s'exécutent sur des serveurs dans des centres de données répartis dans le monde entier. Ces centres de données sont organisés par région géographique. Lorsque vous lancez un EMR cluster Amazon, vous devez spécifier une région. Vous pouvez choisir une région pour réduire la latence, minimiser les coûts ou répondre à des exigences réglementaires. Pour consulter la liste des régions et des points de terminaison pris en charge par AmazonEMR, consultez la section Régions et points de terminaison dans le. Référence générale d'Amazon Web Services
Pour de meilleures performances, vous devez lancer le cluster dans la région où se trouvent vos données. Par exemple, si le compartiment Amazon S3 qui stocke vos données d'entrée se trouve dans la région USA Ouest (Oregon), vous devez lancer votre cluster dans la région USA Ouest (Oregon) pour éviter les frais de transfert de données entre régions. Si vous utilisez un compartiment Amazon S3 pour recevoir les données de sortie du cluster, vous pouvez également le créer dans la région USA Ouest (Oregon).
Si vous envisagez d'associer une paire de EC2 clés Amazon au cluster (obligatoire pour l'utiliser SSH pour vous connecter au nœud principal), la paire de clés doit être créée dans la même région que le cluster. De même, les groupes de sécurité EMR créés par Amazon pour gérer le cluster sont créés dans la même région que le cluster.
Si vous vous êtes inscrit à un compte Compte AWS le 17 mai 2017 ou après cette date, la région par défaut lorsque vous accédez à une ressource AWS Management Console est USA Est (Ohio) (us-east-2) ; pour les anciens comptes, la région par défaut est USA Ouest (Oregon) (us-west-2) ou USA Est (Virginie du Nord) (us-east-1). Pour plus d’informations, consultez Régions et points de terminaison.
Certaines AWS fonctionnalités ne sont disponibles que dans certaines régions. Par exemple, les instances Cluster Compute sont disponibles uniquement dans la région USA Est (Virginie du Nord) et la région Asie-Pacifique (Sydney) prend en charge uniquement Hadoop 1.0.3 ou une version ultérieure. Lorsque vous choisissez une région, vérifiez qu'elle prend en charge les fonctionnalités que vous voulez utiliser.
Pour de meilleures performances, utilisez la même région pour toutes les AWS ressources qui seront utilisées avec le cluster. Le tableau suivant met en correspondance les noms des régions entre les services. Pour obtenir la liste des EMR régions Amazon, consultez la section Régions AWS et les points de terminaison dans le Référence générale d'Amazon Web Services.
Choix d'une région à l'aide de la console
Votre région par défaut est affichée à gauche des informations de votre compte dans la barre de navigation. Pour changer de région dans les nouvelles et les anciennes consoles, choisissez le menu déroulant Région et sélectionnez une nouvelle option.
Spécifiez une région à l'aide du AWS CLI
Spécifiez une région par défaut à l' AWS CLI aide de la aws
configure commande ou de la variable d'AWS_DEFAULT_REGION
environnement. Pour plus d'informations, consultez la section Configuration de la AWS région dans le guide de AWS Command Line Interface l'utilisateur.
Choisissez une région avec un SDK ou API
Pour choisir une région à l'aide d'unSDK, configurez votre application pour qu'elle utilise le point de terminaison de cette région. Si vous créez une application client à l'aide d'un AWS SDK, vous pouvez modifier le point de terminaison client en appelantsetEndpoint
, comme indiqué dans l'exemple suivant :
client.setEndpoint("elasticmapreduce.us-west-2.amazonaws.com");
Une fois que votre application a spécifié une région en définissant le point de terminaison, vous pouvez définir la zone de disponibilité pour les EC2 instances de votre cluster. Les zones de disponibilité sont des emplacements géographiques distincts qui sont conçus pour être isolés des défaillances dans d'autres zones de disponibilité et fournir une connectivité réseau à faible latence et peu onéreuse aux autres zones de disponibilité dans la même région. Une région est constituée d'une ou de plusieurs zones de disponibilité. Pour optimiser les performances et réduire la latence, toutes les ressources doivent être situées dans la même zone de disponibilité que le cluster qui les utilise.