Menu
Amazon EMR
Guia de gerenciamento

Planejar e configurar redes

Pode haver duas opções de plataforma de rede que você pode escolher para o seu cluster: EC2-Classic ou EC2-VPC. No EC2-Classic, suas instâncias executadas em uma única rede simples que você compartilha com outros clientes. O EC2-Classic está disponível somente com certas contas em determinadas regiões. Para obter mais informações, consulte Amazon EC2 e Amazon VPC no Amazon EC2 User Guide for Linux Instances. Em EC2-VPC, seu cluster usa o Amazon Virtual Private Cloud (Amazon VPC), e as instâncias do EC2 são executadas em uma VPC que está logicamente isolado na sua conta da AWS. A Amazon VPC permite que você configurar uma nuvem privada virtual (VPC), uma área isolada dentro da AWS na qual é possível configurar uma rede virtual, controlando aspectos como intervalos de endereços IP privados, sub-redes, tabelas de roteamento e gateways de rede.

A VPC oferece os seguintes recursos:

  • Processamento de dados confidenciais

    Executar um cluster em uma VPC é semelhante a executá-lo em uma rede privada com ferramentas adicionais, como tabelas de roteamento e ACLs de rede, para definir quem tem acesso à rede. Se você estiver processando dados confidenciais no seu cluster, talvez queira o controle de acesso adicional que a execução do seu cluster em uma VPC é capaz de fornecer. Além disso, você pode optar por executar seus recursos em uma sub-rede privada, em que nenhum deles tem conectividade direta com a Internet.

  • Acesso a recursos em uma rede interna

    Se a sua fonte de dados estiver localizado em uma rede privada, talvez seja impraticável ou indesejável fazer upload desses dados na AWS para importação no Amazon EMR, seja por causa da quantidade de dados para transferência ou por causa da natureza sensível dos dados. Em vez disso, você pode executar o cluster em uma VPC e conectar seu datacenter à VPC por meio de conexão VPN, permitindo que o cluster acesse recursos na sua rede interna. Por exemplo, se você tiver um banco de dados Oracle no seu datacenter, o lançamento do seu cluster em uma VPC conectada a essa rede pela VPN torna possível que o cluster acesse o banco de dados Oracle.

Sub-redes públicas e privadas

Você pode executar clusters do EMR em sub-redes VPC públicas e privadas. Isso significa que você não precisa de conectividade com a Internet para executar um cluster EMR. No entanto, talvez seja necessário configurar os gateways de conversão de endereços de rede (NAT) e VPN para acessar serviços ou recursos localizados fora da VPC, por exemplo, em uma intranet corporativa ou em endpoint de serviços da AWS públicos, como o AWS Key Management Service.

Importante

O Amazon EMR só oferece suporte à execução de clusters em sub-redes privadas nas releases 4.2 ou superiores.

Para obter mais informações sobre a Amazon VPC, consulte Amazon VPC User Guide.

Mais recursos para saber mais sobre VPCs

Use os tópicos a seguir para saber mais sobre VPCs e sub-redes.