Criar um cluster com frotas de instâncias ou grupos de instâncias uniformes - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar um cluster com frotas de instâncias ou grupos de instâncias uniformes

Quando você cria um cluster e especifica a configuração do nó primário, dos nós centrais e dos nós de tarefa, existem opções de configuração. Você pode usar frotas de instâncias ou grupos de instâncias uniformes. A opção de configuração escolhida se aplica a todos os nós e pelo tempo de vida do cluster, e frotas de instâncias e grupos de instâncias não podem coexistir em um cluster. A configuração das frotas de instâncias está disponível na Amazon EMR versão 4.8.0 e posterior, excluindo as versões 5.0.x.

Você pode usar o EMR console da Amazon, o AWS CLI, ou a Amazon EMR API para criar clusters com qualquer configuração. Quando você usa o create-cluster comando do AWS CLI, você usa --instance-fleets os parâmetros para criar o cluster usando frotas de instâncias ou, como alternativa, usa os --instance-groups parâmetros para criá-lo usando grupos de instâncias uniformes.

O mesmo acontece usando a Amazon EMRAPI. Você usa também a configuração InstanceGroups para especificar uma matriz de objetos InstanceGroupConfig ou usa a configuração InstanceFleets para especificar uma matriz de objetos InstanceFleetConfig.

No novo EMR console da Amazon, você pode escolher usar grupos de instâncias ou frotas de instâncias ao criar um cluster, e você tem a opção de usar instâncias spot com cada um. Com o antigo EMR console da Amazon, se você usar as configurações padrão de opções rápidas ao criar seu cluster, a Amazon EMR aplica a configuração uniforme de grupos de instâncias ao cluster e usa instâncias sob demanda. Para instâncias spot com grupos de instâncias uniformes ou configurar frotas de instâncias e fazer outras personalizações, escolha Advanced Options (Opções avançadas).

Frotas de instâncias

A configuração de frotas de instâncias oferece a maior variedade de opções de provisionamento para instâncias da Amazon. EC2 Cada tipo de nó tem uma única frota de instâncias, e a frota de instâncias de tarefa é opcional. Você pode especificar até cinco tipos de EC2 instância por frota ou 30 tipos de EC2 instância por frota ao criar um cluster usando o AWS CLI ou Amazon EMR API e uma estratégia de alocação para instâncias sob demanda e spot. Para as frotas de instâncias centrais e de tarefa, você atribui uma capacidade de destino para instâncias sob demanda e outra para instâncias spot. A Amazon EMR escolhe qualquer combinação dos tipos de instância especificados para atender às capacidades desejadas, provisionando tanto instâncias sob demanda quanto instâncias spot.

Para o tipo de nó primário, a Amazon EMR escolhe um único tipo de instância da sua lista de instâncias e você especifica se ele é provisionado como uma instância sob demanda ou spot. As frotas de instâncias também oferecem outras opções para compras de instâncias spot e sob demanda. As opções de instância spot incluem um tempo limite que especifica uma ação a ser tomada, caso não seja possível provisionar a capacidade spot, e uma estratégia de alocação preferencial (otimizada para capacidade) para iniciar frotas de instâncias spot. Também é possível iniciar frotas de instâncias sob demanda usando a opção de estratégia de alocação (menor preço). Se você usar uma função de serviço que não seja a função de serviço EMR padrão ou usar uma política EMR gerenciada em sua função de serviço, precisará adicionar permissões adicionais à função de serviço de cluster personalizada para habilitar a opção de estratégia de alocação. Para obter mais informações, consulte Função de serviço para a Amazon EMR (EMRfunção).

Para obter mais informações sobre como configurar frotas de instâncias, consulte Planejando e configurando frotas de instâncias para seu cluster.

Grupos de instâncias uniformes

Os grupos de instâncias uniformes oferecem uma configuração mais simples do que as frotas de instâncias. Cada EMR cluster da Amazon pode incluir até 50 grupos de instâncias: um grupo de instâncias primário que contém uma EC2 instância da Amazon, um grupo de instâncias principais que contém uma ou mais EC2 instâncias e até 48 grupos de instâncias de tarefas opcionais. Cada grupo de instâncias principais e de tarefas pode conter qualquer número de EC2 instâncias da Amazon. Você pode escalar cada grupo de instâncias adicionando e removendo EC2 instâncias da Amazon manualmente ou pode configurar a escalabilidade automática. Para obter informações sobre como adicionar e remover instâncias, consulte Use a escalabilidade de EMR cluster da Amazon para se ajustar às mudanças nas cargas de trabalho.

Para obter mais informações sobre como configurar grupos de instâncias uniformes, consulte Configurar grupos de instâncias uniformes.

Trabalhar com frotas de instâncias e grupos de instâncias