Escolha uma região da AWS - Amazon EMR

Escolha uma região da AWS

A Amazon Web Services é executada em servidores distribuídos em datacenters ao redor do mundo. Os datacenters são organizados por região geográfica. Ao executar um cluster do Amazon EMR, você deve especificar uma região. É possível escolher a região para reduzir a latência, minimizar custos ou atender a exigências regulamentares. Para obter uma lista de todas as regiões e endpoints compatíveis com o Amazon EMR, consulte Regions and endpoints no Referência geral da Amazon Web Services.

Para obter a melhor performance, você deve executar o cluster na mesma região que os seus dados. Por exemplo, se o bucket do Amazon S3 que armazena seus dados de entrada estiver na região Oeste dos EUA (Oregon), você deverá executar seu cluster na região Oeste dos EUA (Oregon) para evitar taxas de transferência de dados entre regiões. Se você usar um bucket do Amazon S3 para receber a saída do cluster, também deverá criá-lo na região Oeste dos EUA (Oregon).

Se você pretende associar um par de chaves do Amazon EC2 com o cluster (necessário para usar o SSH para logon no nó principal), esse par deverá ser criado na mesma região do cluster. Da mesma forma, os grupos de segurança que o Amazon EMR cria para gerenciar o cluster são criados na mesma região do cluster.

Se você criou uma Conta da AWS a partir de 17 de maio de 2017, a região padrão ao acessar um recurso pelo AWS Management Console é Leste dos EUA (Ohio) (us-east-2); para contas mais antigas, a região padrão é Oeste dos EUA (Oregon) (us-west-2) ou Leste dos EUA (Norte da Virgínia) (us-east-1). Para obter mais informações, consulte Regiões e endpoints.

Alguns atributos da AWS estão disponíveis apenas em regiões limitadas. Por exemplo, instâncias de computação em cluster estão disponíveis apenas na região Leste dos EUA (Norte da Virgínia), e a região Ásia-Pacífico (Sydney) apenas oferece suporte ao Hadoop 1.0.3 e versões posteriores. Ao escolher uma região, verifique se ela oferece suporte aos atributos que você deseja usar.

Para obter a melhor performance, use a mesma região para todos os seus recursos da AWS que serão usados com o cluster. A tabela a seguir mapeia os nomes de regiões entre serviços. Para conferir a lista de regiões do Amazon EMR, consulte Regiões da AWS and endpoints na Referência geral da Amazon Web Services.

Escolher uma região usando o console

A região padrão é exibida à esquerda das informações da conta na barra de navegação. Para trocar de região no console novo ou no antigo, escolha o menu suspenso Região e selecione uma nova opção.

Especificar uma região usando a AWS CLI

Especifique uma região padrão na AWS CLI usando o comando aws configure ou a variável de ambiente AWS_DEFAULT_REGION. Para obter mais informações, consulte Configuring the AWS Region no Guia do usuário da AWS Command Line Interface.

Escolher uma região usando um SDK ou a API

Para escolher uma região usando um SDK, configure sua aplicação para usar o endpoint dessa região. Se estiver criando uma aplicação cliente usando um AWS SDK, você poderá alterar o endpoint do cliente chamando setEndpoint, como mostra o exemplo a seguir:

client.setEndpoint("elasticmapreduce.us-west-2.amazonaws.com");

Depois que a aplicação tiver especificado uma região definindo o endpoint, você poderá definir a zona de disponibilidade para instâncias do EC2 do cluster. As zonas de disponibilidade são as localizações geográficas distintas que são criadas para serem isoladas das falhas em outras zonas da disponibilidade e fornecem rede de conectividade acessível e de baixa latência a outras zonas de disponibilidade da mesma região. Uma região contém uma ou mais zonas de disponibilidade. Para otimizar o desempenho e reduzir a latência, todos os recursos devem estar localizados na mesma zona de disponibilidade do cluster que os utiliza.