Selecione a melhor chave de classificação - Amazon Redshift

Selecione a melhor chave de classificação

O Amazon Redshift armazena seus dados no disco em ordem classificada de acordo com a chave de classificação. O otimizador de consulta Amazon Redshift usa a ordem de classificação quando determina os planos de consulta ideais.

nota

Ao usar a otimização automática de tabela, você não precisa escolher a chave de classificação de sua tabela. Para ter mais informações, consulte Trabalhar com otimização automática de tabelas.

Seguem algumas sugestões para a melhor abordagem:

  • Para que o Amazon Redshift escolha a ordem de classificação apropriada, especifique AUTO para a chave de classificação.

  • Se dados recentes forem mais consultados, especifique a coluna de time stamp como a coluna principal da chave de classificação.

    As consultas são mais eficientes, pois podem ignorar blocos inteiros que estão fora do período.

  • Se você fizer filtragem de intervalos frequentes ou filtragem de igualdade em uma coluna, especifique esta coluna como a chave de classificação.

    O Amazon Redshift pode ignorar a leitura de blocos inteiros de dados para essa coluna. É possível fazer isso, pois ele rastreia os valores mínimo e máximo da coluna armazenados em cada bloco e pode ignorar blocos que não se aplicam ao intervalo previsto.

  • Se você costuma ingressar em uma tabela, especifique a coluna de união como a chave de classificação e a chave de distribuição.

    Isso permite que o otimizador de consulta escolha uma junção de mesclagem de classificação em vez de uma junção hash mais lenta. Como os dados já são classificados na chave de junção, o otimizador de consulta pode ignorar a fase de classificação da junção de mesclagem de classificação.