Etapa 1: Criar um cluster de amostra do Amazon Redshift - Amazon Redshift

Etapa 1: Criar um cluster de amostra do Amazon Redshift

Neste tutorial, você acompanhará o processo para criar um cluster do Amazon Redshift com um banco de dados. Depois, você carregará um conjunto de dados do Amazon S3 para tabelas do banco de dados. Você pode usar esse cluster para avaliar o serviço do Amazon Redshift.

Antes de começar a configurar um cluster do Amazon Redshift, não se esqueça de cumprir todos os pré-requisitos necessários, como Como se cadastrar na AWS e Determinar regras de firewall.

Para qualquer operação que acesse dados de outro recurso da AWS, seu cluster precisa de permissão para acessar o recurso e os dados no recurso em seu nome. Um exemplo é o uso de um comando SQL COPY para carregar dados do Amazon Simple Storage Service (Amazon S3). Você concede essas permissões usando o AWS Identity and Access Management (IAM). É possível fazer isso por meio de um perfil do IAM criado e associado ao cluster. Para ter mais informações sobre credenciais e permissões de acesso, consulte Credenciais e permissões de acesso no Guia do desenvolvedor de banco de dados do Amazon Redshift.

Para criar um cluster do Amazon Redshift.
  1. Faça login no AWS Management Console e abra o console do Amazon Redshift em https://console.aws.amazon.com/redshiftv2/.

    Importante

    Se você usar credenciais de usuário do IAM, verifique se o usuário tem as permissões necessárias para realizar as operações de cluster. Para ter mais informações, consulte Segurança no Amazon Redshift no Guia de gerenciamento do Amazon Redshift.

  2. No Console da AWS, escolha a Região da AWS onde você deseja criar o cluster.

  3. No menu de navegação, escolha Clusters e Create cluster (Criar cluster). A página Create cluster (Criar cluster) é exibida.

  4. Na seção Configuração do cluster, especifique valores para o Identificador de cluster, o Tipo de nó, e os Nós:

    • Identificador de cluster: digite examplecluster para este tutorial. Esse identificador deve ser exclusivo. O identificador deve ter entre 1 e 63 caracteres usando como caracteres válidos a-z (somente minúsculas) e - (hífen).

    • Escolha um dos seguintes métodos para dimensionar o cluster:

      nota

      A etapa a seguir pressupõe uma Região da AWS que comporte tipos de nó RA3. Para conferir a lista de Regiões da AWS compatíveis com tipos de nó RA3, consulte Visão geral dos tipos de nó RA3 no Guia de gerenciamento do Amazon Redshift. Para saber mais sobre as especificações de cada tipo e tamanho de nó, consulte Detalhes do tipo de nó.

      • Se você não souber o tamanho do cluster, escolha Ajude-me a escolher. Isso abre uma calculadora de dimensionamento que faz perguntas sobre o tamanho e as características da consulta dos dados que você planeja armazenar no data warehouse.

        Se você souber o tamanho necessário do cluster (ou seja, o tipo de nó e o número de nós), escolha Eu escolherei. Em seguida, escolha o Node type (Tipo de nó) e número de Nodes (Nós) para dimensionar seu cluster para a prova de conceito.

        Para este tutorial, escolha ra3.4xlarge em Tipo de nó e 2 em Número de nós.

        Se uma opção para a Configuração AZ estiver disponível, selecione Single-AZ.

      • Para usar o conjunto de dados de amostra que o Amazon Redshift fornece, em Dados de amostra, escolha Carregar dados de amostra. O Amazon Redshift carrega o Tickit do conjunto de dados de amostra para o banco de dados dev padrão e o esquema public.

  5. Na seção Configuração do banco de dados, especifique um valor para Nome do usuário administrador. Em Senha do administrador, escolha uma das seguintes opções:

    • Gere uma senha: use uma senha gerada pelo Amazon Redshift.

    • Adicionar manualmente uma senha de administrador: use a própria senha.

    • Gerenciar credenciais de administrador no AWS Secrets Manager: o Amazon Redshift usa AWS Secrets Manager para gerar e gerenciar a senha de administrador. O uso do AWS Secrets Manager para gerar e gerenciar o segredo da senha incorre em uma taxa. Para obter informações sobre definição de preços do AWS Secrets Manager, consulte Definição de preços do AWS Secrets Manager.

    Para este tutorial, use estes valores:

    • Nome do usuário administrador: digite awsuser.

    • Senha do usuário administrador: insira um valor para a senha.

  6. Para este tutorial, crie uma função do IAM e a defina como padrão para o cluster, conforme descrito a seguir. Só pode haver um conjunto de funções do IAM padrão por cluster.

    1. Em Cluster permissions (Permissões de cluster), em Manage IAM roles (Gerenciar funções do IAM), escolha Create IAM role (Criar função do IAM).

    2. Especifique um bucket do Amazon S3 para que a função do IAM seja acessada por um destes métodos:

      • Escolha No additional Amazon S3 bucket (Nenhum bucket adicional do Amazon S3) para permitir que a função do IAM criada acesse somente os buckets do Amazon S3 que são nomeados como redshift.

      • Selecione Any Amazon S3 bucket (Qualquer bucket do Amazon S3) para permitir que a função do IAM criada acesse todos os buckets do Amazon S3.

      • Escolha Specific Amazon S3 buckets (Buckets específicos do Amazon S3) para especificar um ou mais buckets do Amazon S3 para que a função do IAM acesse. Em seguida, escolha um ou mais buckets do Amazon S3 na tabela.

    3. Escolha Create IAM role as default (Criar função do IAM como padrão). O Amazon Redshift cria e define automaticamente a função do IAM como padrão para o cluster.

      Como você criou sua função do IAM pelo console, ela tem a política AmazonRedshiftAllCommandsFullAccess anexada. Isso permite que o Amazon Redshift copie, carregue, consulte e analise dados de recursos da Amazon em sua conta do IAM.

    Para ter informações sobre como gerenciar o perfil padrão do IAM para um cluster, consulte Criar uma função do IAM como padrão para o Amazon Redshift no Guia de gerenciamento do Amazon Redshift.

  7. (Opcional) Na seção Additional configurations (Configurações adicionais), desative Use defaults (Usar padrões) para modificar as configurações Network and security (Rede e segurança), Database configuration (Configuração do banco de dados), Maintenance (Manutenção), Monitoring (Monitoramento) e Backup.

    Em alguns casos, você pode criar o cluster com a opção Load sample data (Carregar dados de exemplo) e ativar o roteamento aprimorado da Amazon VPC. Se for o caso, o cluster de sua Virtual Private Cloud (VPC) precisa acessar o endpoint do Amazon S3 para que os dados sejam carregados.

    Há dois métodos para tornar o cluster acessível ao público. Configure um endereço de conversão de endereço de rede (NAT) em sua VPC para que o cluster acesse a Internet. Ou configure um endpoint da VPC do Amazon S3 em sua VPC. Para ter mais informações sobre o roteamento aprimorado da Amazon VPC, consulte Enhanced VPC routing no Guia de gerenciamento do Amazon Redshift.

  8. Selecione Criar cluster. Aguarde até que o cluster seja criado com o status Available na página Clusters.