Choix de la meilleure clé de tri - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Choix de la meilleure clé de tri

Amazon Redshift stocke vos données sur le disque dans un ordre trié selon la clé de tri. L'optimiseur de requête Amazon Redshift utilise l'ordre de tri lorsqu'il détermine les plans de requête optimaux.

Note

Lorsque vous utilisez l'optimisation automatique des tables, vous n'avez pas besoin de choisir la clé de tri de votre table. Pour plus d'informations, consultez Utilisation de l’optimisation automatique des tables.

Voici quelques suggestions pour la meilleure approche :

  • Pour qu'Amazon Redshift choisisse l'ordre de tri approprié, spécifiez AUTO pour la clé de tri.

  • Si les données récentes sont interrogées le plus fréquemment, spécifiez la colonne d'horodatage en tant que colonne principale de la clé de tri.

    Les requêtes sont plus efficaces, car elles peuvent ignorer des blocs entiers qui ne relèvent pas de la plage de temps.

  • Si vous effectuez le filtrage par plage ou par égalité sur une seule colonne, spécifiez cette colonne comme clé de tri.

    Amazon Redshift peut omettre la lecture de blocs entiers de données pour cette colonne. Il peut le faire car il assure le suivi des valeurs de colonne minimales et maximales stockées sur chaque bloc et peut ignorer les blocs qui ne s'appliquent pas à la plage de prédicats.

  • Si vous effectuez fréquemment la jointure d'une table, spécifiez la colonne de jointure à la fois comme clé de tri et comme clé de distribution.

    Cela permet à l'optimiseur de requête de choisir une sorte de jointure de fusion triée au lieu d'une jointure de hachage plus lente. Étant donné que les données sont déjà triées sur la clé de jointure, l'optimiseur de requête peut contourner la phase de tri de la jointure de fusion triée.