Trabalhar com a escalabilidade de simultaneidade - Amazon Redshift

Trabalhar com a escalabilidade de simultaneidade

Com o recurso de escalabilidade da simultaneidade, é possível oferecer suporte a milhares de usuários e consultas simultâneos, com performance de consulta consistentemente rápida. Ao ativar a escalabilidade de simultaneidade, o Amazon Redshift adicionará automaticamente capacidade de cluster para processar um aumento em consultas de leitura e de gravação. Os usuários veem os dados mais atuais, sejam as consultas executadas no cluster principal ou em um cluster de escalabilidade de simultaneidade.

É possível gerenciar quais consultas são enviadas ao cluster de escalabilidade simultânea configurando filas WLM. Quando você ativa a escalabilidade de simultaneidade, as consultas elegíveis são enviadas para o cluster de escalabilidade de simultaneidade em vez de esperar em uma fila.

Você é cobrado por clusters de escalabilidade de simultaneidade apenas pelo tempo em que estão executando ativamente as consultas. Para obter mais informações sobre preços, incluindo como as cobranças são acumuladas e cobranças mínimas, consulte Preço da escalabilidade de simultaneidade.

Recursos de escalabilidade de simultaneidade

Quando você ativa a escalabilidade de simultaneidade para uma fila do WLM, ele funciona para operações de leitura, como consultas de painel. Ele também funciona para operações de gravação comumente usadas, como instruções para ingestão e processamento de dados.

Recursos de escalabilidade de simultaneidade para operações de gravação

A escalabilidade de simultaneidade oferece suporte a operações de gravação usadas com frequência, como instruções de extrair, transformar e carregar (ETL). A escalabilidade de simultaneidade para operações de gravação é especialmente útil quando você deseja manter tempos de resposta consistentes quando o cluster recebe um grande número de solicitações. Ele melhora a taxa de transferência para operações de gravação disputando recursos no cluster principal.

A escalabilidade de simultaneidade dá suporte a instruções COPY, INSERT, DELETE, UPDATE e CREATE TABLE AS (CTAS). Além disso, a escalabilidade de simultaneidade dá suporte à atualização de visão materializada para MVs que não usam agregações. Outras instruções Data Manipulation Language (DML) e Data Definition Language (DDL) não são compatíveis. Quando instruções de gravação não compatíveis, como CREATE sem TABLE AS, são incluídas em uma transação explícita antes das instruções de gravação compatíveis, nenhuma das instruções de gravação será executada em clusters de escalabilidade de simultaneidade.

Quando você provisiona crédito para escalabilidade de simultaneidade, essa provisão de crédito se aplica a operações de leitura e gravação.

Limitações para a escalabilidade de simultaneidade

Veja a seguir limitações para usar a escalabilidade de simultaneidade do Amazon Redshift:

  • Ela não oferece suporte a consultas em tabelas que usam chaves de classificação intercaladas.

  • Ela não oferece suporte a consultas em tabelas temporárias.

  • Ela não oferece suporte a consultas que acessam recursos externos protegidos por configurações restritivas de rede ou Virtual Private Cloud (VPC).

  • O recurso não é compatível com consultas que contêm funções definidas pelo usuário (UDFs) em Python e UDFs em Lambda.

  • Ela não suporta consultas que acessam tabelas de sistema, tabelas de catálogo PostgreSQL ou tabelas sem backup.

  • Ela não permite consultas COPY ou UNLOAD que acessam um recurso externo quando permissões da política do IAM estão em vigor. Isso inclui permissões aplicadas a um recurso, como um bucket do Amazon S3 ou uma tabela do DynamoDB, ou à origem. As origens do IAM podem incluir o seguinte:

    • aws:sourceVpc: uma VPC de origem.

    • aws:sourceVpce: um endpoint da VPC de origem.

    • aws:sourceIp: um endereço IP de origem.

    Em alguns casos, pode ser necessário remover permissões que restringem o recurso ou a origem, para que as consultas COPY e UNLOAD que acessam o recurso sejam enviadas ao cluster de escalabilidade simultânea.

    Para obter mais informações sobre políticas de recursos, consulte Tipos de políticas no guia do usuário do AWS Identity and Access Management e Controlar o acesso a partir de VPC endpoints com políticas de bucket.

  • A escalabilidade de simultaneidade do Amazon Redshift para operações de gravação não é compatível com operações DDL, como CREATE TABLE ou ALTER TABLE.

  • Não oferece suporte a ANALYZE para o comando COPY.

  • Ela não suporta operações de gravação em uma tabela de destino onde DISTSTYLE está definido como ALL.

  • COPY não é compatível com os seguintes formatos de arquivo:

    • Parquet

    • ORC

  • Ela não suporta operações de gravação em tabelas com colunas de identidade.

  • O Amazon Redshift suporta escalabilidade de simultaneidade para operações de gravação em apenas nós do Amazon Redshift RA3, especificamente ra3.16xlarge, ra3.4xlarge e ra3.xlplus. A escalabilidade de simultaneidade para operações de gravação não é aceita em outros tipos de nó.

Para obter mais informações sobre a escalabilidade de simultaneidade, consulte os seguintes tópicos no Guia de gerenciamento de clusters do Amazon Redshift.