Visão geral dos clusters provisionados do Amazon Redshift - Amazon Redshift

Visão geral dos clusters provisionados do Amazon Redshift

O serviço do Amazon Redshift gerencia todo o trabalho de configuração, operação e escalabilidade de um data warehouse. Essas tarefas incluem capacidade de provisionamento, monitoramento e backup do cluster e aplicação de patches e atualizações ao mecanismo Amazon Redshift.

O vídeo a seguir mostra como criar um cluster e consultar dados usando o editor de consultas do Amazon Redshift v2.

Gerenciamento de clusters

Um cluster do Amazon Redshift é um conjunto de nós que consiste em um nó líder e um ou mais nós de computação. O tipo e o número de nós de computação que você precisa dependem do tamanho de seus dados, do número de consultas que você executará e da performance do runtime de consulta necessária.

Criar e gerenciar clusters

Dependendo de suas necessidades de data warehousing, você pode começar com um cluster pequeno de nó único e facilmente escalar para um cluster maior de vários nós à medida que suas exigências mudam. Você pode adicionar ou remover nós de computação do cluster sem nenhuma interrupção no serviço. Para ter mais informações, consulte Clusters provisionados do Amazon Redshift.

Reservar nós de computação

Se você pretende manter seu cluster em execução durante um ano ou mais, pode economizar reservando nós de computação para um período de um ano ou três anos. A reserva de nós de computação oferece economia significativa em comparação às taxas por hora que você paga quando provisiona nós de computação sob demanda. Para ter mais informações, consulte Comprar nós reservados do Amazon Redshift.

Criar snapshots de cluster

Snapshots são backups pontuais de um cluster. Existem dois tipos de snapshots: automatizados e manuais. O Amazon Redshift armazena esses snapshots internamente no Amazon Simple Storage Service (Amazon S3) usando uma conexão Secure Sockets Layer (SSL) criptografada. Se você precisar restaurar a partir de um instantâneo, o Amazon Redshift cria um novo cluster e importa dados do snapshot que você especificar. Para obter mais informações sobre snapshots, consulte Snapshots e backups do Amazon Redshift.

Segurança e acesso a clusters

Existem vários recursos relacionados ao acesso ao cluster e à segurança no Amazon Redshift. Esses recursos ajudam você a controlar o acesso ao seu cluster, definir regras de conectividade e criptografas dados e conexões. Esses recursos são adicionais aos recursos relacionados ao acesso ao banco de dados e à segurança no Amazon Redshift. Para obter mais informações sobre segurança de banco de dados, consulte Gerenciar segurança do banco de dados no Guia do desenvolvedor de banco de dados do Amazon Redshift.

Contas da AWS e credenciais do IAM

Por padrão, um cluster do Amazon Redshift é acessível apenas para a conta da AWS que cria o cluster. O cluster é bloqueado para que ninguém mais tenha acesso. Em sua conta da AWS, você usa o serviço AWS Identity and Access Management (IAM) para criar contas de usuário e gerenciar permissões para essas contas para controlar as operações de cluster. Para ter mais informações, consulte Segurança no Amazon Redshift. Para obter mais informações sobre o gerenciamento de identidades do IAM, incluindo orientação e práticas recomendadas para perfis do IAM, consulte Gerenciamento de Identidade e Acesso no Amazon Redshift.

Grupos de segurança

Por padrão, qualquer cluster que você criar é fechado para todos. As credenciais do IAM do controlam somente o acesso aos recursos relacionados à API do Amazon Redshift: o console do Amazon Redshift, a interface de linha de comando (CLI), a API e o SDK. Para permitir acesso ao cluster a partir de ferramentas de cliente SQL via JDBC ou ODBC, você usa security groups:

  • Se você estiver usando a plataforma EC2-VPC para seu cluster Amazon Redshift, você deve usar grupos de segurança da VPC. Recomendamos que você execute o cluster em uma plataforma EC2-VPC.

    Não será possível mover um cluster para uma VPC depois que ele for executado com a plataforma EC2-Classic. No entanto, você pode restaurar um snapshot EC2-Classic para um cluster EC2-VPC usando o console do Amazon Redshift. Para ter mais informações, consulte Restauração de um cluster usando um snapshot.

  • Se você estiver usando a plataforma EC2-Classic para seu cluster Amazon Redshift, você deve usar grupos de segurança do Amazon Redshift.

Em ambos os casos, você adiciona regras ao grupo de segurança para conceder acesso de entrada explícito a um intervalo específico de endereços CIDR IP ou a um grupo de segurança do Amazon Elastic Compute Cloud (Amazon EC2) se seu cliente SQL for executado em uma instância do Amazon EC2. Para ter mais informações, consulte Grupos de segurança de clusters do Amazon Redshift.

Além das regras de acesso de entrada, você cria usuários do banco de dados para fornecer credenciais para autenticar o banco de dados no próprio cluster. Para obter mais informações, consulte Bancos de dados neste tópico.

Criptografia

Quando você provisiona o cluster, opcionalmente, pode optar por criptografar o cluster para segurança adicional. Quando você habilitar a criptografia, o Amazon Redshift armazena todos os dados em tabelas criadas pelo usuário em um formato criptografado. Você pode usar o AWS Key Management Service (AWS KMS) para gerenciar suas chaves de criptografia do Amazon Redshift.

A criptografia é uma propriedade imutável do cluster. A única forma de mudar de um cluster criptografado para um cluster não criptografado é descarregar os dados e recarregá-los em um novo cluster. A criptografia aplica-se ao cluster e a todos os backups. Quando você restaura um cluster a partir de um snapshot criptografado, o novo cluster também é criptografado.

Para obter mais informações sobre a criptografia, chaves e módulos de segurança de hardware, consulte Criptografia de banco de dados do Amazon Redshift.

Conexões SSL

Você pode usar criptografia de Secure Sockets Layer (SSL) para criptografar a conexão entre o cliente SQL e seu cluster. Para ter mais informações, consulte Configurar as opções de segurança para conexões.

Monitoramento de clusters

Existem vários recursos relacionados ao monitoramento no Amazon Redshift. Você pode usar o registro em log de auditoria do banco de dados para gerar logs de atividades, configurar eventos e assinaturas de notificações para rastrear informações de seu interesse. Use as métricas no Amazon Redshift e no Amazon CloudWatch para saber sobre a integridade e a performance de seus clusters e bancos de dados.

Registro em log da auditoria de banco de dados

Você pode usar o recurso de registro de auditoria do banco de dados para acompanhar informações sobre tentativas de autenticação, conexões, desconexões, alterar as definições de usuário do banco de dados e consultas executadas no banco de dados. Essas informações são úteis para fins de segurança e de solução de problemas no Amazon Redshift. Os logs são armazenados em buckets do Amazon S3. Para ter mais informações, consulte Registro em log da auditoria de banco de dados.

Eventos e notificações

O Amazon Redshift rastreia eventos e retém informações sobre eles por um período de várias semanas em sua conta da AWS. Para cada evento, o Amazon Redshift registra informações como a data em que o evento ocorreu, uma descrição, a fonte do evento (por exemplo, um cluster, um grupo de parâmetros ou um snapshot) e a ID da fonte. Você pode criar assinaturas de notificação de eventos do Amazon Redshift que especificam um conjunto de filtros de eventos. Quando ocorre um evento que corresponde aos critérios do filtro, o Amazon Redshift usa o Amazon Simple Notification Service para informar que o evento ocorreu. Para obter mais informações sobre eventos e notificações, consulte Eventos do Amazon Redshift.

Performance

O Amazon Redshift fornece dados e métricas de performance para que você possa rastrear a integridade e a performance de seus clusters e bancos de dados. O Amazon Redshift usa métricas do Amazon CloudWatch para monitorar os aspectos físicos do cluster, como utilização da CPU, latência e taxa de transferência. O Amazon Redshift também fornece dados de performance de consulta e carga para ajudá-lo a monitorar a atividade do banco de dados em seu cluster. Para obter mais informações sobre métricas de performance e monitoramento, consulte Monitorar a performance do cluster do Amazon Redshift.

Bancos de dados

O Amazon Redshift cria um banco de dados quando você provisiona um cluster. Este é o banco de dados que você usa para carregar dados e executar consultas em seus dados. Você pode criar bancos de dados adicionais executando um comando SQL, conforme necessário. Para obter mais informações sobre a criação de bancos de dados adicionais, vá para a Etapa 1: Criar um banco de dados no Guia do desenvolvedor de banco de dados do Amazon Redshift.

Ao provisionar um cluster, você especifica um usuário administrador que tem acesso a todos os bancos de dados criados no cluster. Este usuário administrados é um superusuário que é, inicialmente, o único usuário com acesso ao banco de dados, embora esse usuário possa criar outros superusuários e usuários. Para obter mais informações, acesse Superusuários e Usuários no Guia do desenvolvedor de banco de dados do Amazon Redshift.

O Amazon Redshift usa grupos de parâmetros para definir o comportamento de todos os bancos de dados em um cluster, como estilo de apresentação de data e precisão de ponto flutuante. Se você não especificar um grupo de parâmetros ao provisionar seu cluster, o Amazon Redshift associa um grupo de parâmetros padrão ao cluster. Para ter mais informações, consulte Grupos de parâmetros do Amazon Redshift.

Para obter mais informações sobre bancos de dados no Amazon Redshift, acesse o Guia do desenvolvedor de banco de dados do Amazon Redshift.