Configurar redes - Amazon EMR

Configurar redes

A maioria dos clusters é iniciada na rede virtual usando a Amazon Virtual Private Cloud (Amazon VPC). A VPC é uma rede virtual isolada na AWS que está logicamente isolada em sua conta da AWS. É possível configurar aspectos como intervalos de endereços IP privados, sub-redes, tabelas de roteamento e gateways de rede. Para obter mais informações, consulte o Manual do usuário da Amazon VPC.

A VPC oferece os seguintes recursos:

  • Processamento de dados confidenciais

    Executar um cluster em uma VPC é semelhante a executá-lo em uma rede privada com ferramentas adicionais, como tabelas de roteamento e ACLs de rede, para definir quem tem acesso à rede. Se você estiver processando dados confidenciais no seu cluster, talvez queira o controle de acesso adicional que a execução do seu cluster em uma VPC é capaz de fornecer. Além disso, você pode optar por executar seus recursos em uma sub-rede privada, em que nenhum deles tem conectividade direta com a Internet.

  • Acesso a recursos em uma rede interna

    Se a sua fonte de dados estiver localizada em uma rede privada, talvez seja impraticável ou indesejável carregar esses dados na AWS para importação no Amazon EMR, seja por causa da quantidade de dados para transferência ou por causa da natureza sigilosa dos dados. Em vez disso, você pode executar o cluster em uma VPC e conectar seu datacenter à VPC por meio de conexão VPN, permitindo que o cluster acesse recursos na sua rede interna. Por exemplo, se você tiver um banco de dados Oracle no seu datacenter, o lançamento do seu cluster em uma VPC conectada a essa rede pela VPN torna possível que o cluster acesse o banco de dados Oracle.

Sub-redes públicas e privadas

Você pode executar clusters do Amazon EMR em sub-redes VPC públicas e privadas. Isso significa que você não precisa de conectividade com a Internet para executar um cluster do Amazon EMR. No entanto, talvez seja necessário configurar os gateways de conversão de endereços de rede (NAT) e VPN para acessar serviços ou recursos localizados fora da VPC, por exemplo, em uma intranet corporativa ou em endpoint de serviços da AWS públicos, como o AWS Key Management Service.

Importante

O Amazon EMR só oferece suporte à inicialização de clusters em sub-redes privadas nas versões 4.2 ou posteriores.

Para obter mais informações sobre o Amazon VPC, consulte o Guia do usuário da Amazon VPC.

Mais recursos para saber mais sobre VPCs

Use os tópicos a seguir para saber mais sobre VPCs e sub-redes.