Como se cadastrar na AWS Determinar regras de firewall Etapa 1: Criar um cluster de exemplo Etapa 2: Configurar regras de entrada para clientes SQL Etapa 3: Conceder acesso a um cliente SQL e executar consultas Etapa 4: Carregar dados do Amazon S3 para o Amazon Redshift Etapa 5: Experimentar exemplo de consultas usando o editor de consultas Etapa 6: Redefinir o ambiente

Conceitos básicos de data warehouses provisionados do Amazon Redshift

Se estiver usando o Amazon Redshift pela primeira vez, recomendamos que leia as seções a seguir que ajudarão a começar a usar clusters provisionados. O fluxo básico do Amazon Redshift é criar recursos provisionados, conectar-se ao Amazon Redshift, carregar dados de amostra e executar consultas nos dados. Neste guia, você pode escolher carregar dados de amostra do Amazon Redshift ou de um bucket do Amazon S3. Os dados de amostra são usados em toda a documentação do Amazon Redshift para demonstrar os recursos.

Este tutorial demonstra como usar clusters provisionados pelo Amazon Redshift, que são objetos de data warehouse da AWS para os quais você gerencia recursos do sistema. Você também pode usar o Amazon Redshift com grupos de trabalho sem servidor, que são objetos de data warehouse que escalam automaticamente em resposta ao uso. Para começar a usar o Redshift sem servidor, consulte Conceitos básicos de data warehouse do Amazon Redshift sem servidor.

Depois de criar e fazer login no console provisionado do Amazon Redshift, você poderá criar e gerenciar objetos do Amazon Redshift, inclusive clusters, nós e bancos de dados. Você também poderá executar e visualizar consultas, além de outras operações de linguagem de definição de dados (DDL) e de linguagem de manipulação de dados (DML) SQL.

Importante

O cluster provisionado para este exercício é executado em um ambiente ativo. Enquanto estiver em execução, ele vai acumular cobranças na Conta da AWS. Para obter informações sobre preço, consulte a página de preço do Amazon Redshift.

Para evitar cobranças desnecessárias, exclua seu cluster quando terminar de usá-lo. A seção final deste capítulo explica como fazer isso.

Faça login no AWS Management Console e abra o console do Amazon Redshift em https://console.aws.amazon.com/redshiftv2/.

Recomendamos que você comece acessando o Painel de clusters provisionado para começar a usar o console do Amazon Redshift.

Dependendo da configuração, os seguintes itens aparecem no painel de navegação do console provisionado do Amazon Redshift:

Redshift sem servidor: acesse e analise dados sem a necessidade de configurar, ajustar e gerenciar clusters provisionados do Amazon Redshift.
Painel de clusters provisionado: veja a lista de clusters na Região da AWS, confira as Métricas de cluster e a Visão geral da consulta para ter insights sobre dados de métricas (como utilização da CPU) e informações de consulta. Usá-los pode ajudar você a determinar se seus dados de performance são anormais em um intervalo de tempo especificado.
Clusters: veja a lista de clusters nessa Região da AWS, escolha um cluster para iniciar a consulta ou realize ações relacionadas ao cluster. Também é possível criar um novo cluster a partir desta página.
Editor de consultas: execute consultas em bancos de dados hospedados no cluster do Amazon Redshift. Em vez disso, recomendamos usar o Editor de Consultas v2.
Editor de Consultas v2: o Editor de Consultas do Amazon Redshift v2 é uma aplicação de cliente SQL separada, baseada na web, para criar e executar consultas no data warehouse do Amazon Redshift. Você pode visualizar seus resultados em gráficos e compartilhar suas consultas com outras pessoas de sua equipe.
Queries and loads (Consultas e cargas): obtenha informações para referência ou solução de problemas, como uma lista de consultas recentes e o texto SQL de cada consulta.
Datashares (Unidades de compartilhamento de dados): como administrador de uma conta de produtor, autorize contas de consumidor a acessar unidades de compartilhamento de dados ou escolha não autorizar o acesso. Para usar uma unidade de compartilhamento de dados autorizada, um administrador de conta de consumidor pode associá-la a toda uma Conta da AWS ou especificar namespaces de cluster em uma conta. Um administrador também pode recusar uma unidade de compartilhamento de dados.
Integrações ETL zero: gerencie integrações que disponibilizam dados transacionais no Amazon Redshift depois de serem gravados em fontes compatíveis.
Conexões do Centro de Identidade do IAM: configure a conexão entre o Amazon Redshift e o Centro de Identidade do IAM.
Configurations (Configurações): conecte-se a clusters do Amazon Redshift por meio de ferramentas de cliente SQL em conexões JDBC (Java Database Connectivity) e ODBC (Open Database Connectivity). Também é possível configurar um endpoint da Virtual Private Cloud (VPC) gerenciado pelo Amazon Redshift. Isso fornece uma conexão privada entre uma VPC com base no serviço da Amazon VPC que contém um cluster e outra VPC que está executando uma ferramenta cliente.
Integração de parceiro da AWS: crie integração com um parceiro da AWS compatível.
Advisor (Consultor): obtenha recomendações específicas sobre as alterações que você pode fazer em seu cluster do Amazon Redshift para priorizar suas otimizações.
AWS Marketplace: obtenha informações sobre outras ferramentas ou serviços da AWS que funcionam com o Amazon Redshift.
Alarms (Alarmes): crie alarmes em métricas de cluster para exibir dados de performance e rastrear métricas durante um período especificado.
Events (Eventos): monitore eventos e receba relatórios sobre informações como a data em que o evento ocorreu, uma descrição ou a origem do evento.
What's new (Novidades): veja os novos recursos e as atualizações de produtos do Amazon Redshift.

Neste tutorial, você realizará as seguintes etapas:

As etapas neste tutorial, descritas a seguir

Tópicos

Como se cadastrar na AWS
Determinar regras de firewall
Etapa 1: Criar um cluster de amostra do Amazon Redshift
Etapa 2: Configurar regras de entrada para clientes SQL
Etapa 3: Conceder acesso a um cliente SQL e executar consultas
Etapa 4: Carregar dados do Amazon S3 para o Amazon Redshift
Etapa 5: Experimentar exemplo de consultas usando o editor de consultas
Etapa 6: Redefinir o ambiente

Caso você ainda não tenha uma Conta da AWS, cadastre-se. Se você já tem uma conta, pode pular esse pré-requisito e usar sua conta existente.

Abra https://portal.aws.amazon.com/billing/signup.
Siga as instruções online.

Parte do procedimento de inscrição envolve receber uma chamada telefônica ou uma mensagem de texto e inserir um código de verificação pelo teclado do telefone.

Quando você se inscreve para uma Conta da AWS, um Usuário raiz da conta da AWS é criado. O usuário-raiz tem acesso a todos os Serviços da AWS e recursos na conta. Como prática recomendada de segurança, atribua o acesso administrativo a um usuário e use somente o usuário-raiz para executar tarefas que exigem acesso de usuário-raiz.

Determinar regras de firewall

nota

Este tutorial pressupõe que o cluster use a porta padrão 5439 e que o Editor de Consultas do Amazon Redshift v2 possa ser usado para executar comandos SQL. Ele não entra em detalhes sobre as configurações de rede nem sobre a configuração de um cliente SQL que possa ser necessário no ambiente.

Em alguns ambientes, você deve especificar uma porta ao iniciar o cluster do Amazon Redshift. Você usa essa porta com o URL do endpoint do cluster para acessar o cluster. Você também criará uma regra de entrada em um grupo de segurança para conceder acesso ao cluster por meio da porta.

Se o seu computador cliente estiver atrás de um firewall, verifique se você conhece uma porta aberta que pode ser usada. Essa porta aberta permite que você se conecte ao cluster a partir de uma ferramenta de cliente SQL e execute consultas. Se você não souber isso, trabalhe com alguém que entenda as regras de firewall da rede para determinar uma porta aberta em seu firewall.

Embora o Amazon Redshift use a porta 5439 por padrão, a conexão não funcionará se essa porta não estiver aberta no firewall. Não é possível alterar o número da porta do cluster do Amazon Redshift depois que ela é criada. Portanto, certifique-se de especificar uma porta que funciona em seu ambiente durante o processo de inicialização.

Etapa 1: Criar um cluster de amostra do Amazon Redshift

Neste tutorial, você acompanhará o processo para criar um cluster do Amazon Redshift com um banco de dados. Depois, você carregará um conjunto de dados do Amazon S3 em tabelas do banco de dados. Você pode usar esse cluster para avaliar o serviço do Amazon Redshift.

Antes de começar a configurar um cluster do Amazon Redshift, não se esqueça de cumprir todos os pré-requisitos necessários, como Como se cadastrar na AWS e Determinar regras de firewall.

Para qualquer operação que acesse dados de outro recurso da AWS, seu cluster precisa de permissão para acessar o recurso e os dados no recurso em seu nome. Um exemplo é o uso de um comando SQL COPY para carregar dados do Amazon Simple Storage Service (Amazon S3). Você concede essas permissões usando o AWS Identity and Access Management (IAM). É possível fazer isso por meio de um perfil do IAM criado e associado ao cluster. Para ter mais informações sobre credenciais e permissões de acesso, consulte Credenciais e permissões de acesso no Guia do desenvolvedor de banco de dados do Amazon Redshift.

Para criar um cluster do Amazon Redshift.

Faça login no AWS Management Console e abra o console do Amazon Redshift em https://console.aws.amazon.com/redshiftv2/.

Importante
Se você usar credenciais de usuário do IAM, verifique se o usuário tem as permissões necessárias para realizar as operações de cluster. Para ter mais informações, consulte Segurança no Amazon Redshift no Guia de gerenciamento do Amazon Redshift.
No Console da AWS, escolha a Região da AWS onde você deseja criar o cluster.
No menu de navegação, escolha Clusters e Create cluster (Criar cluster). A página Create cluster (Criar cluster) é exibida.
Na seção Configuração do cluster, especifique valores para o Identificador de cluster, o Tipo de nó, e os Nós:
- Identificador de cluster: digite examplecluster para este tutorial. Esse identificador deve ser exclusivo. O identificador deve ter entre 1 e 63 caracteres usando como caracteres válidos a-z (somente minúsculas) e - (hífen).
- Escolha um dos seguintes métodos para dimensionar o cluster:
  
  nota
  A etapa a seguir pressupõe uma Região da AWS que comporte tipos de nó RA3. Para conferir a lista de Regiões da AWS compatíveis com tipos de nó RA3, consulte Visão geral dos tipos de nó RA3 no Guia de gerenciamento do Amazon Redshift. Para saber mais sobre as especificações de cada tipo e tamanho de nó, consulte Detalhes do tipo de nó.
  - Se você não souber o tamanho do cluster, escolha Ajude-me a escolher. Isso abre uma calculadora de dimensionamento que faz perguntas sobre o tamanho e as características da consulta dos dados que você planeja armazenar no data warehouse.
    
    Se você souber o tamanho necessário do cluster (ou seja, o tipo de nó e o número de nós), escolha Eu escolherei. Em seguida, escolha o Node type (Tipo de nó) e número de Nodes (Nós) para dimensionar seu cluster para a prova de conceito.
    
    Para este tutorial, escolha ra3.4xlarge em Tipo de nó e 2 em Número de nós.
    
    Se uma opção para a Configuração AZ estiver disponível, selecione Single-AZ.
  - Para usar o conjunto de dados de amostra que o Amazon Redshift fornece, em Dados de amostra, escolha Carregar dados de amostra. O Amazon Redshift carrega o Tickit do conjunto de dados de amostra para o banco de dados dev padrão e o esquema public.
Na seção Configuração do banco de dados, especifique um valor para Nome do usuário administrador. Em Senha do administrador, escolha uma das seguintes opções:
- Gere uma senha: use uma senha gerada pelo Amazon Redshift.
- Adicionar manualmente uma senha de administrador: use a própria senha.
- Gerenciar credenciais de administrador no AWS Secrets Manager: o Amazon Redshift usa AWS Secrets Manager para gerar e gerenciar a senha de administrador. O uso do AWS Secrets Manager para gerar e gerenciar o segredo da senha incorre em uma taxa. Para obter informações sobre definição de preços do AWS Secrets Manager, consulte Definição de preços do AWS Secrets Manager.
Para este tutorial, use estes valores:
- Nome do usuário administrador: digite awsuser.
- Senha do usuário administrador: insira Changeit1 para a senha.
Para este tutorial, crie uma função do IAM e a defina como padrão para o cluster, conforme descrito a seguir. Só pode haver um conjunto de funções do IAM padrão por cluster.
1. Em Cluster permissions (Permissões de cluster), em Manage IAM roles (Gerenciar funções do IAM), escolha Create IAM role (Criar função do IAM).
2. Especifique um bucket do Amazon S3 para que a função do IAM seja acessada por um destes métodos:
  - Escolha No additional Amazon S3 bucket (Nenhum bucket adicional do Amazon S3) para permitir que a função do IAM criada acesse somente os buckets do Amazon S3 que são nomeados como redshift.
  - Selecione Any Amazon S3 bucket (Qualquer bucket do Amazon S3) para permitir que a função do IAM criada acesse todos os buckets do Amazon S3.
  - Escolha Specific Amazon S3 buckets (Buckets específicos do Amazon S3) para especificar um ou mais buckets do Amazon S3 para que a função do IAM acesse. Em seguida, escolha um ou mais buckets do Amazon S3 na tabela.
3. Escolha Create IAM role as default (Criar função do IAM como padrão). O Amazon Redshift cria e define automaticamente a função do IAM como padrão para o cluster.
  
  Como você criou sua função do IAM pelo console, ela tem a política AmazonRedshiftAllCommandsFullAccess anexada. Isso permite que o Amazon Redshift copie, carregue, consulte e analise dados de recursos da Amazon em sua conta do IAM.
Para ter informações sobre como gerenciar o perfil padrão do IAM para um cluster, consulte Criar uma função do IAM como padrão para o Amazon Redshift no Guia de gerenciamento do Amazon Redshift.
(Opcional) Na seção Additional configurations (Configurações adicionais), desative Use defaults (Usar padrões) para modificar as configurações Network and security (Rede e segurança), Database configuration (Configuração do banco de dados), Maintenance (Manutenção), Monitoring (Monitoramento) e Backup.

Em alguns casos, você pode criar o cluster com a opção Load sample data (Carregar dados de exemplo) e ativar o roteamento aprimorado da Amazon VPC. Se for o caso, o cluster de sua Virtual Private Cloud (VPC) precisa acessar o endpoint do Amazon S3 para que os dados sejam carregados.

Há dois métodos para tornar o cluster acessível ao público. Configure um endereço de conversão de endereço de rede (NAT) em sua VPC para que o cluster acesse a Internet. Ou configure um endpoint da VPC do Amazon S3 em sua VPC. Para ter mais informações sobre o roteamento aprimorado da Amazon VPC, consulte Enhanced VPC routing no Guia de gerenciamento do Amazon Redshift.
Selecione Criar cluster. Aguarde até que o cluster seja criado com o status Available na página Clusters.

Etapa 2: Configurar regras de entrada para clientes SQL

nota

Recomendamos que você ignore esta etapa e acesse o cluster usando o Editor de Consultas do Amazon Redshift v2.

Mais adiante neste tutorial, você acessará seu cluster de dentro de uma nuvem privada virtual (VPC) com base no serviço da Amazon VPC. No entanto, se você usar um cliente SQL de fora do firewall para acessar o cluster, certifique-se de conceder acesso de entrada.

Para verificar o firewall e conceder acesso de entrada a seu cluster

Verifique as regras do firewall quando seu cluster precisar ser acessado de fora de um firewall. Por exemplo, seu cliente pode ser uma instância do Amazon Elastic Compute Cloud (Amazon EC2) ou um computador externo.

Consulte mais informações sobre regras de firewall em Regras de grupos de segurança no Guia do usuário do Amazon EC2.
Para acessar de um cliente externo Amazon EC2, adicione uma regra de entrada ao grupo de segurança anexado ao seu cluster que permite o tráfego de entrada. Adicione regras de grupo de segurança do Amazon EC2 no console do Amazon EC2. Por exemplo, um CIDR/IP de 192.0.2.0/24 permite que os clientes nesse endereço IP se conectem ao seu cluster. Descubra o CIDR/IP correto para o seu ambiente.

Etapa 3: Conceder acesso a um cliente SQL e executar consultas

Para consultar bancos de dados hospedados pelo cluster do Amazon Redshift, há algumas opções para clientes SQL. Isso inclui:

Conecte-se ao cluster e execute consultas usando o Editor de Consultas do Amazon Redshift v2.

Se você usar o Editor de Consultas v2, não precisará baixar e configurar uma aplicação de cliente SQL. Você pode iniciar o Editor de Consultas do Amazon Redshift v2 por meio do console do Amazon Redshift.
Conecte-se ao cluster usando RSQL. Para ter mais informações, consulte Conectar-se com o Amazon Redshift RSQL no Guia de gerenciamento do Amazon Redshift.
Conecte-se ao cluster por meio de uma ferramenta de cliente SQL, como o SQL Workbench/J. Para ter mais informações, consulte Conectar-se com SQL Workbench/J no Guia de gerenciamento do Amazon Redshift.

Este tutorial usa o Editor de Consultas do Amazon Redshift v2 como um método fácil para executar consultas em bancos de dados hospedados pelo cluster do Amazon Redshift. Após a criação do cluster, é possível executar consultas imediatamente. Para ter detalhes sobre as considerações ao usar o Editor de Consultas do Amazon Redshift v2, consulte Considerações ao trabalhar com o editor de consultas v2 no Guia de gerenciamento do Amazon Redshift.

Conceder acesso ao editore de consultas v2

Na primeira vez que um administrador configura o editor de consultas v2 para sua Conta da AWS, ele escolhe a AWS KMS key que será usada para criptografar recursos do editor de consultas v2. Os recursos do Editor de Consultas do Amazon Redshift v2 incluem consultas, cadernos e gráficos salvos. Por padrão, uma chave de propriedade da AWS é usada para criptografar recursos. Como alternativa, um administrador pode usar uma chave gerenciada pelo cliente escolhendo o nome do recurso da Amazon (ARN) da chave na página de configuração. Depois que você configurar uma conta, as configurações de criptografia do AWS KMS não poderão ser alteradas. Para ter mais informações, consulte Configurar sua Conta da AWS no Guia de gerenciamento do Amazon Redshift.

Para acessar o editor de consultas v2, é necessário ter permissão. Um administrador pode associar uma das políticas gerenciadas pela AWS para o Editor de Consultas do Amazon Redshift v2 ao usuário ou perfil do IAM para conceder permissões. Essas políticas gerenciadas pela AWS são redigidas com diferentes opções que controlam como os recursos de marcação permitem o compartilhamento de consultas. Você pode usar o console do IAM (https://console.aws.amazon.com/iam/) para anexar políticas do IAM. Consulte mais informações sobre essas políticas em Acessar o editor de consultas v2 no Guia de gerenciamento do Amazon Redshift.

Você também pode criar sua própria política com base nas permissões concedidas e negadas nas políticas gerenciadas fornecidas. Se usar o editor de políticas de console do IAM para criar sua própria política, escolha SQL Workbench como o serviço para o qual você está criando a política no editor visual. O editor de consultas v2 usa o nome do serviço AWS SQL Workbench no editor visual e no IAM Policy Simulator.

Para obter mais informações, consulte Trabalhar com o editor de consultas v2 no Guia de gerenciamento do Amazon Redshift.

Etapa 4: Carregar dados do Amazon S3 para o Amazon Redshift

Depois de criar o cluster, você poderá carregar dados do Amazon S3 nas tabelas do banco de dados. Há várias maneiras de carregar dados do Amazon S3.

É possível usar um cliente SQL para executar o comando SQL CREATE TABLE e criar uma tabela no banco de dados e, depois, usar o comando SQL COPY para carregar dados do Amazon S3. O Editor de Consultas do Amazon Redshift v2 é um cliente SQL.
É possível usar o assistente de carregamento do Editor de Consultas do Amazon Redshift v2.

Este tutorial demonstra como usar o Editor de Consultas V2 do Amazon Redshift para executar comandos SQL para CRIAR tabelas e COPIAR dados. Inicie o Editor de Consultas v2 no painel de navegação do console do Amazon Redshift. No Editor de Consultas v2, crie uma conexão com o cluster examplecluster e o banco de dados denominado dev com o usuário administrador awsuser. Para este tutorial, escolha Credenciais temporárias usando um nome de usuário do banco de dados ao criar a conexão. Para ter detalhes sobre como usar o Editor de Consultas do Amazon Redshift, v2, consulte Conectar-se a um banco de dados do Amazon Redshift no Guia de gerenciamento do Amazon Redshift.

Carregar dados do Amazon S3 usando comandos SQL

No painel de edição de consultas do Editor de Consultas v2, confirme que você já se conectou com o cluster examplecluster e o banco de dados dev. Depois, crie tabelas no banco de dados e carregue dados nelas. Para este tutorial, os dados carregados estão disponíveis em um bucket do Amazon S3, acessível por meio de várias Regiões da AWS.

O procedimento a seguir cria tabelas e carrega dados de um bucket público do Amazon S3.

Use o Editor de Consultas do Amazon Redshift v2 para copiar e executar a declaração de criação de tabelas e criar uma tabela no esquema public do banco de dados dev. Para obter mais informações sobre a sintaxe, consulte CREATE TABLE no Guia do desenvolvedor de banco de dados do Amazon Redshift.

Como criar e carregar dados usando um cliente SQL, como o Editor de Consultas v2

Execute o comando SQL a seguir para CRIAR a tabela sales.



   drop table if exists sales;
   create table sales(
	salesid integer not null,
	listid integer not null distkey,
	sellerid integer not null,
	buyerid integer not null,
	eventid integer not null,
	dateid smallint not null sortkey,
	qtysold smallint not null,
	pricepaid decimal(8,2),
	commission decimal(8,2),
	saletime timestamp);

Execute o comando SQL a seguir para CRIAR a tabela date.



drop table if exists date;              
create table date(
	dateid smallint not null distkey sortkey,
	caldate date not null,
	day character(3) not null,
	week smallint not null,
	month character(5) not null,
	qtr character(5) not null,
	year smallint not null,
	holiday boolean default('N'));

Carregue a tabela sales do Amazon S3 usando o comando COPY.

nota
Recomendamos usar o comando COPY para carregar grandes conjuntos de dados no Amazon Redshift por meio do Amazon S3. Para obter mais informações sobre sintaxe de COPY, consulte COPY no Guia do desenvolvedor de banco de dados do Amazon Redshift.

Forneça autenticação ao seu cluster para acessar o Amazon S3 em seu nome para carregar os dados de amostra. Você pode oferecer autenticação fazendo referência ao perfil do IAM criado e definido como default para o cluster ao escolher Criar função do IAM como padrão na criação do cluster.

Carregue a tabela sales usando o comando SQL a seguir. Como alternativa, é possível baixar e visualizar os dados de origem do Amazon S3 para a tabela sales. .
```
COPY sales
    FROM 's3://redshift-downloads/tickit/sales_tab.txt' 
    DELIMITER '\t' 
    TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' 
    REGION 'us-east-1'
    IAM_ROLE default;
```
Carregue a tabela date usando o comando SQL a seguir. Como alternativa, é possível baixar e visualizar os dados de origem do Amazon S3 para a tabela date. .
```
COPY date
    FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' 
    DELIMITER '|' 
    REGION 'us-east-1'
    IAM_ROLE default;
```

Carregar dados do Amazon S3 usando o Editor de Consultas v2

Esta seção descreve de que forma você carrega seus dados em um cluster do Amazon Redshift. O Editor de Consultas v2 simplifica o carregamento de dados ao usar o assistente Carregar dados. O comando COPY gerado e utilizado no assistente Carregar dados do Editor de Consultas v2 é compatível com muitos parâmetros disponíveis para a sintaxe do comando COPY para carregar dados do Amazon S3. Para obter informações sobre o comando COPY e suas opções usadas para copiar a carga do Amazon S3, consulte COPY do Amazon Simple Storage Service no Guia do desenvolvedor do Amazon Redshift.

Para carregar seus dados do Amazon S3 para o Amazon Redshift, o Amazon Redshift requer uma função do IAM que tenha os privilégios necessários para carregar dados do bucket do Amazon S3 especificado.

Para carregar seus dados do Amazon S3 para o Amazon Redshift, você pode usar o assistente de carregamento de dados do Editor de Consultas V2. Para ter informações sobre como usar o assistente de carregamento de dados, consulte Carregar dados do Amazon S3 no Guia de gerenciamento do Amazon Redshift.

Criar dados TICKIT no cluster

O TICKIT é um banco de dados de exemplo que você pode carregar opcionalmente em seu cluster do Amazon Redshift com o objetivo de aprender a consultar dados no Amazon Redshift. É possível criar o conjunto completo de tabelas TICKIT e carregar dados no cluster das seguintes maneiras:

Ao criar um cluster no console do Amazon Redshift, você tem a opção de carregar dados TICKIT de exemplo simultaneamente. No console do Amazon Redshift, selecione Clusters e Criar cluster. Na seção Dados de exemplo, selecione Carregar dados de exemplo. O Amazon Redshift carregará automaticamente o conjunto de dados de exemplo para o banco de dados dev do cluster do Amazon Redshift durante a criação do cluster.
Para se conectar a um cluster existente, faça o seguinte:
- No console do Amazon Redshift, no painel de navegação, selecione Clusters.
- Escolha seu cluster no painel Clusters.
- Escolha Consultar dados e Consultar no Editor de Consultas v2.
- Expanda examplecluster na lista de recursos. Se esta for a primeira vez que você se conecta ao cluster, a opção Conectar a examplecluster é exibida. Escolha Nome de usuário e senha do banco de dados. Deixe o banco de dados como dev. Especifique awsuser para o nome de usuário e Changeit1 para a senha.
- Escolha Criar conexão.
Com o Editor de Consultas do Amazon Redshift v2, é possível carregar dados TICKIT em um banco de dados de exemplo chamado sample_data_dev. Escolha o banco de dados sample_data_dev na lista de recursos. Ao lado do nó tickit, escolha o ícone Abrir cadernos de exemplo. Confirme que você deseja criar o banco de dados de exemplo.
O Editor de Consultas do Amazon Redshift v2 cria o banco de dados de exemplo além de um caderno de exemplo chamado tickit-sample-notebook. Você pode escolher Executar tudo para executar esse caderno e consultar dados no banco de dados de exemplo.

Para visualizar detalhes sobre os dados TICKIT, consulte Banco de dados de exemplo no Guia do desenvolvedor de banco de dados do Amazon Redshift.

Etapa 5: Experimentar exemplo de consultas usando o editor de consultas

Para configurar e usar o Editor de Consultas do Amazon Redshift v2 e consultar um banco de dados, confira Trabalhar com o editor de consultas v2 no Guia de gerenciamento do Amazon Redshift.

Agora, tente alguns exemplos de consultas, como mostrado a seguir. Para criar consultas no Editor de Consultas V2, escolha o ícone + no canto superior direito do painel de consulta e selecione SQL. Uma nova página de consulta é exibida, na qual você pode copiar e colar as consultas SQL a seguir.

nota

Primeiro, você deve executar a primeira consulta no caderno, que define a configuração search_path do servidor para o esquema tickit usando o seguinte comando SQL:


set search_path to tickit;

Para ter mais informações sobre como trabalhar com o comando SELECT, consulte SELECT no Guia do desenvolvedor de banco de dados do Amazon Redshift.


-- Get definition for the sales table.
SELECT *    
FROM pg_table_def    
WHERE tablename = 'sales';


-- Find total sales on a given calendar date.
SELECT sum(qtysold) 
FROM   sales, date 
WHERE  sales.dateid = date.dateid 
AND    caldate = '2008-01-05';


-- Find top 10 buyers by quantity.
SELECT firstname, lastname, total_quantity 
FROM   (SELECT buyerid, sum(qtysold) total_quantity
        FROM  sales
        GROUP BY buyerid
        ORDER BY total_quantity desc limit 10) Q, users
WHERE Q.buyerid = userid
ORDER BY Q.total_quantity desc;


-- Find events in the 99.9 percentile in terms of all time gross sales.
SELECT eventname, total_price 
FROM  (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile 
       FROM (SELECT eventid, sum(pricepaid) total_price
             FROM   sales
             GROUP BY eventid)) Q, event E
       WHERE Q.eventid = E.eventid
       AND percentile = 1
ORDER BY total_price desc;

Etapa 6: Redefinir o ambiente

Nas etapas anteriores, você criou com êxito um cluster do Amazon Redshift, carregou dados em tabelas e consultou dados usando um cliente SQL, como o Editor de Consultas do Amazon Redshift v2.

Ao concluir este tutorial, sugerimos que você reconfigure seu ambiente para o estado anterior, excluindo seu cluster de amostra. Você continuará a ser cobrado pelo serviço do Amazon Redshift até excluir o cluster.

No entanto, convém manter o cluster de exemplo em execução se pretende experimentar tarefas em outros guias do Amazon Redshift ou tarefas descritas em Executar comandos para definir e usar um banco de dados no data warehouse.

Para excluir um cluster

Faça login no AWS Management Console e abra o console do Amazon Redshift em https://console.aws.amazon.com/redshiftv2/.
No menu de navegação, escolha Clusters para exibir sua lista de clusters.
Escolha o cluster examplecluster. Em Ações, escolha Excluir. A página Delete examplecluster? é exibida.
Confirme o cluster a ser excluído, desmarque a configuração Criar snapshot final e insira delete para confirmar a exclusão. Escolha Delete Cluster (Excluir cluster).

Na página da lista de clusters, o status do cluster é atualizado uma vez que o cluster está excluído.

Depois de concluir este tutorial, você pode encontrar mais informações sobre o Amazon Redshift e as próximas etapas em Recursos adicionais para saber mais sobre o Amazon Redshift.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Conceitos básicos de data warehouses de tecnologia sem servidor

Definir e usar um banco de dados no data warehouse