Etapa 1: Criar um cluster de amostra do Amazon Redshift - Amazon Redshift

Etapa 1: Criar um cluster de amostra do Amazon Redshift

Para qualquer operação que acesse dados de outro recurso da AWS, seu cluster precisa de permissão para acessar o recurso e os dados no recurso em seu nome. Um exemplo é o uso de um comando COPY para carregar dados do Amazon Simple Storage Service (Amazon S3). Você concede essas permissões usando o AWS Identity and Access Management (IAM). Você pode fazer isso por meio de uma função do IAM associada ao cluster. Ou você pode fornecer a chave de acesso AWS para um usuário do IAM que tenha as permissões necessárias. Para obter mais informações sobre credenciais e permissões de acesso, consulte Credenciais e permissões de acesso.

Para melhor proteger seus dados confidenciais e salvaguardar suas credenciais de acesso da AWS, recomendamos criar uma função do IAM e anexá-la ao seu cluster. Para obter mais informações sobre como fornecer permissões de acesso, consulte Permissões para acessar outros recursos da AWS.

O cluster que você está prestes a criar está ativo e não está sendo executado em uma sandbox. Você será cobrado pelas taxas de uso padrão do Amazon Redshift para o cluster até que o exclua. Se você concluir o tutorial descrito aqui em uma sessão e excluir o cluster quando terminar, o total de cobranças será mínimo.

Para criar um cluster do Amazon Redshift.

  1. Faça login no AWS Management Console e abra o console do Amazon Redshift em https://console.aws.amazon.com/redshift/.

    Importante

    Se você usar credenciais de usuário do IAM, verifique se o usuário tem as permissões necessárias para realizar as operações de cluster. Para obter mais informações, consulte Controle de acesso a usuários do IAM no Guia de gerenciamento de clusters do Amazon Redshift.

  2. Na parte superior direita, escolha a Região da AWS onde você deseja criar o cluster.

  3. No menu de navegação, escolha Clusters e Create cluster (Criar cluster). A página Create cluster (Criar cluster) é exibida.

  4. Na seção Configuração do cluster, especifique valores para o Identificador de cluster, o Tipo de nó, e os Nós:

    • Identificador de cluster: digite examplecluster para este tutorial. Esse identificador deve ser exclusivo. O identificador deve ter entre 1 e 63 caracteres usando como caracteres válidos a-z (somente minúsculas) e - (hífen).

    • Escolha um dos seguintes métodos para dimensionar o cluster:

      nota

      A etapa a seguir pressupõe uma região da AWS que oferece suporte a tipos de nó RA3. Para uma lista de regiões da AWS que suportam tipos de nó RA3, consulte Visão geral dos tipos de nó RA3 no Guia de gerenciamento de clusters do Amazon Redshift.

      • Se suas região da AWS suporta tipos de nó RA3, escolha Produção ou Teste gratuito para responder à pergunta Para que você está planejando usar esse cluster?

        Se sua organização estiver qualificada, você poderá criar um cluster no programa gratuito de teste do Amazon Redshift. Para obter informações sobre como criar clusters usando o programa gratuito de teste, consulte Usar um conjunto de dados de amostra. Para fazer isso, selecione Teste gratuito para criar uma configuração com o tipo de nó dc2.large. Para obter mais informações sobre a escolha de um teste gratuito, consulte Teste gratuito do Amazon Redshift.

      • Se você não souber o tamanho do cluster, escolha Ajude-me a escolher. Isso inicia uma calculadora de dimensionamento que faz perguntas sobre o tamanho e as características da consulta dos dados que você planeja armazenar no data warehouse.

        Se você souber o tamanho necessário do cluster (ou seja, o tipo de nó e o número de nós), escolha Eu escolherei. Em seguida, escolha o Tipo de nó e número de Nós para dimensionar seu cluster para a prova de conceito.

    • Para este tutorial, escolha dc2.large em Node type (Tipo de nó) e 2 em Nodes (Nós).

    • Se você escolheu Produção em seu cluster, siga um destes procedimentos:

      • Para usar o conjunto de dados de amostra que o Amazon Redshift fornece, em Dados de amostra, escolha Carregar dados de amostra. O Amazon Redshift carrega o Tickit do conjunto de dados de amostra para o banco de dados dev padrão e o esquema public.

      • Para trazer seus próprios dados para o Amazon Redshift, continue com o restante do tutorial.

  5. Na seção Configuração do banco de dados, especifique valores para Nome do banco de dados (opcional), Portabilidade do banco de dados (opcional), Nome do usuário administrador, eSenha do usuário administrador. Ou escolha Gerar senha para usar uma senha gerada pelo Amazon Redshift.

    Para este tutorial, use estes valores:

    • Nome do banco de dados (opcional): digite dev.

    • Portabilidade do banco de dados (opcional): digite 5439.

    • Nome do usuário administrador: digite awsuser.

    • Senha do usuário administrador: insira um valor para a senha.

  6. Para este tutorial, crie uma função do IAM e a defina como padrão para o cluster, conforme descrito a seguir. Só pode haver um conjunto de funções do IAM padrão por cluster.

    1. Em Cluster permissions (Permissões de cluster), em Manage IAM roles (Gerenciar funções do IAM), escolha Create IAM role (Criar função do IAM).

    2. Especifique um bucket do Amazon S3 para que a função do IAM seja acessada por um destes métodos:

      • Escolha No additional Amazon S3 bucket (Nenhum bucket adicional do Amazon S3) para permitir que a função do IAM criada acesse somente os buckets do Amazon S3 que são nomeados como redshift.

      • Selecione Any Amazon S3 bucket (Qualquer bucket do Amazon S3) para permitir que a função do IAM criada acesse todos os buckets do Amazon S3.

      • Escolha Specific Amazon S3 buckets (Buckets específicos do Amazon S3) para especificar um ou mais buckets do Amazon S3 para que a função do IAM acesse. Em seguida, escolha um ou mais buckets do Amazon S3 na tabela.

    3. Escolha Create IAM role as default (Criar função do IAM como padrão). O Amazon Redshift cria e define automaticamente a função do IAM como padrão para o cluster.

      Como você criou sua função do IAM pelo console, ela tem a política AmazonRedshiftAllCommandsFullAccess anexada. Isso permite que o Amazon Redshift copie, carregue, consulte e analise dados de recursos da Amazon em sua conta do IAM.

    Para obter informações sobre como gerenciar a função do IAM padrão para um cluster, consulte Criar uma função do IAM como padrão para o Amazon Redshift.

  7. (Opcional) Na seção Additional configurations (Configurações adicionais), desative Use defaults (Usar padrões) para modificar as configurações Network and security (Rede e segurança), Database configuration (Configuração do banco de dados), Maintenance (Manutenção), Monitoring (Monitoramento) e Backup.

    Em alguns casos, você pode criar o cluster com a opção Load sample data (Carregar dados de exemplo) e ativar o roteamento aprimorado da Amazon VPC. Se for o caso, o cluster de sua Virtual Private Cloud (VPC) precisa acessar o endpoint do Amazon S3 para que os dados sejam carregados.

    Há dois métodos para tornar o cluster acessível ao público. Configure um endereço de conversão de endereço de rede (NAT) em sua VPC para que o cluster acesse a Internet. Ou configure um endpoint da VPC do Amazon S3 em sua VPC. Para obter mais informações sobre o roteamento aprimorado do Amazon VPC, consulte Habilitar o roteamento aprimorado da Amazon VPC no Guia de gerenciamento de clusters do Amazon Redshift.

  8. Selecione Create cluster (Criar cluster).