Choisissez une région AWS - Amazon EMR

Choisissez une région AWS

Amazon Web Services s'exécutent sur des serveurs dans des centres de données répartis dans le monde entier. Ces centres de données sont organisés par région géographique. Lorsque vous lancez un cluster Amazon EMR, vous devez spécifier une région. Vous pouvez choisir une région pour réduire la latence, minimiser les coûts ou répondre à des exigences réglementaires. Pour obtenir la liste des régions et points de terminaison pris en charge par Amazon EMR, consultez Régions et points de terminaison dans le Référence générale d'Amazon Web Services.

Pour de meilleures performances, vous devez lancer le cluster dans la région où se trouvent vos données. Par exemple, si le compartiment Amazon S3 qui stocke vos données d'entrée se trouve dans la région USA Ouest (Oregon), vous devez lancer votre cluster dans la région USA Ouest (Oregon) pour éviter les frais de transfert de données entre régions. Si vous utilisez un compartiment Amazon S3 pour recevoir les données de sortie du cluster, vous pouvez également le créer dans la région USA Ouest (Oregon).

Si vous envisagez d'associer une paire de clés Amazon EC2 au cluster (requis pour utiliser SSH pour vous connecter au nœud principal), la paire de clés doit être créée dans la même région que le cluster. De même, les groupes de sécurité qu'Amazon EMR crée pour gérer le cluster sont créés dans la même région que le cluster.

Si vous vous êtes inscrit à un compte Compte AWS le 17 mai 2017 ou après cette date, la région par défaut lorsque vous accédez à une ressource depuis la AWS Management Console est USA Est (Ohio) (us-east-2) ; pour les anciens comptes, la région par défaut est USA Ouest (Oregon) (us-west-2) ou USA Est (Virginie du Nord) (us-east-1). Pour de plus amples informations, consultez Regions and Endpoints (Régions et points de terminaison) .

Certaines fonctionnalités AWS sont disponibles uniquement dans des régions limitées. Par exemple, les instances Cluster Compute sont disponibles uniquement dans la région USA Est (Virginie du Nord) et la région Asie-Pacifique (Sydney) prend en charge uniquement Hadoop 1.0.3 ou une version ultérieure. Lorsque vous choisissez une région, vérifiez qu'elle prend en charge les fonctionnalités que vous voulez utiliser.

Pour de meilleures performances, utilisez la même région pour toutes vos ressources AWS qui seront utilisées avec le cluster. Le tableau suivant met en correspondance les noms des régions entre les services. Pour obtenir la liste des régions Amazon EMR, consultez Régions AWS et points de terminaison dans le Référence générale d'Amazon Web Services.

Choix d'une région à l'aide de la console

Votre région par défaut est affichée à gauche des informations de votre compte dans la barre de navigation. Pour changer de région dans les nouvelles et les anciennes consoles, choisissez le menu déroulant Région et sélectionnez une nouvelle option.

Spécifier une région à l'aide de l'AWS CLI

Spécifiez une région par défaut dans l'AWS CLI en utilisant soit la commande aws configure ou la variable d'environnement AWS_DEFAULT_REGION. Pour plus d'informations, veuillez consulter configuration de la région AWS dans le Guide de l'utilisateur AWS Command Line Interface.

Choix d'une région à l'aide d'un kit SDK ou de l'API

Pour choisir une région à l'aide d'un kit SDK, configurez votre application pour utiliser le point de terminaison de cette région. Si vous créez une application cliente à l'aide d'un kit SDK AWS, vous pouvez changer le point de terminaison client en appelant setEndpoint, comme illustré dans l'exemple suivant :

client.setEndpoint("elasticmapreduce.us-west-2.amazonaws.com");

Une fois que votre application a spécifié une région en définissant le point de terminaison, vous pouvez définir la zone de disponibilité pour les instances EC2 de votre cluster. Les zones de disponibilité sont des emplacements géographiques distincts qui sont conçus pour être isolés des défaillances dans d'autres zones de disponibilité et fournir une connectivité réseau à faible latence et peu onéreuse aux autres zones de disponibilité dans la même région. Une région est constituée d'une ou de plusieurs zones de disponibilité. Pour optimiser les performances et réduire la latence, toutes les ressources doivent être situées dans la même zone de disponibilité que le cluster qui les utilise.